Buscar

Avaliacao_Projeto_em_ciencia_de_dados_com_solucoes_para_processamento_paralelo_e_distribuido_de_dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

Projeto em ciência de dados com soluções para processamento
paralelo e distribuído de dados
Professor(a): Yuri Vasconcelos de Almeida Sá (Especialização)
1)
2)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta 
objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automati
corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabe
prova!
Sobre o uso de linguagem Python para tratamento de big data, avalie as afirmativas a seguir e classifique com (V) se
verdadeira e (F) se falsa.
( ) A linguagem Python foi criada em 1999.
( ) A compilação da linguagem Python precisa de um interpretador interno à máquina onde é executada.
( ) A linguagem Python utiliza o recurso de indentação para eliminar o uso excessivo de parênteses.
( ) O recurso de indentação serve para definir ou destacar a estrutura de um algoritmo.
( ) Um comentário escrito em um script de linguagem Python pode ser escrito entre aspas simples.
Assinale a alternativa que contenha a sequência correta.
Alternativas:
F – V – F – V – F.
V – V – F – V – F.
V – V – V – V – V.
F – V – V – V – F.  CORRETO
V – F – F – F – V.
Código da questão: 50723
Sobre a linguagem de programação R e suas características, avalie as afirmativas a seguir.
I. A linguagem R tem em sua construção estrutural semelhanças com a linguagem S.
II. A linguagem R é composta por vários pacotes ou bibliotecas.
III. A linguagem R não tem a capacidade de dialogar com outras linguagens de programação.
IV. A IDE mais popular da linguagem R é o Anaconda Spyder.
V. A otimização de programação em linguagem R pode ser realizada com uma função “aplly”.
São verdadeiras:
Resolução comentada:
A linguagem Python foi criada em 1989. A compilação da linguagem Python precisa de um interpretador interno à má
onde é executada. A linguagem Python utiliza o recurso de indentação para eliminar o uso excessivo de parênteses.
recurso de indentação serve para definir ou destacar a estrutura de um algoritmo. Um comentário escrito em um scri
linguagem Python pode ser escrito entre três aspas simples.
Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde...
1 of 6 21/02/2023 13:48
3)
4)
Alternativas:
III - IV - V.
III - V.
I II - V.  CORRETO
I - II - IV.
II - IV.
Código da questão: 50727
O uso otimizado da linguagem de programação R pode ser feito a partir da vetorização de funções em seu ambiente.
dessas funções realiza a pré-alocação de memória com o uso de estruturas de dados mais simplificados. Qual o nome d
função?
Assinale a alternativa CORRETA.
Alternativas:
glm.
apply.  CORRETO
cbind.
rbind.
matrix.
Código da questão: 50725
A respeito dos sistemas distribuídos, avalie as asserções a seguir e a relação existente entre elas.
I. Falhas independentes se referem à capacidade que cada componente do sistema distribuído tem em poder falhar
independentemente, sendo que outros componentes podem permanecer em plena atividade.
PORQUE
II. Em sistemas distribuídos, as falhas resultam em isolamento do componente que falhou, ou seja, os componentes que
ficam isolados da rede, podendo não parar de funcionar, apenas ficarem isolados.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas.
Resolução comentada:
A linguagem R tem em sua construção estrutural semelhanças com a linguagem S, e é composta por vários
pacotes/bibliotecas. Ela tem capacidade de dialogar com diversas outras linguagens de programação. A IDE mais po
da linguagem R é o RStudio. A otimização de programação em linguagem R pode ser realizada com uma função “ap
Resolução comentada:
O uso otimizado da linguagem de programação R pode ser feito a partir da vetorização de funções em seu ambiente
por exemplo, pela função apply.
Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde...
2 of 6 21/02/2023 13:48
5)
Alternativas:
As asserções I e II estão corretas, mas a segunda não justifica a primeira.
A asserção I está correta, e a asserção II está incorreta.
As asserções I e II estão corretas e, a segunda justifica a primeira.  CORRETO
As asserções I e II estão incorretas.
A asserção I está incorreta, e a asserção II está correta.
Código da questão: 50704
A análise de desempenho de sistemas paralelos é importante por uma série de justificativas que podem ser elencada
as características da análise de desempenho com abordagem online, avalie as afirmativas a seguir e assinale V para ve
F para falsa.
( ) A abordagem online também é conhecida como abordagem post-mortem.
( ) A ausência de custo de manutenção de dados é uma das principais características.
( ) O custo de manutenção de dados é uma vantagem, porque há a necessidade de armazenamento de dados em disco
( ) A falta de escalabilidade é uma de suas principais desvantagens.
( ) Uma de suas características é a necessidade de gravação de informações durante a execução.
Assinale a alternativa que contenha a sequência CORRETA
Alternativas:
V – V – F – V – F.
F – V – F – V – F.  CORRETO
F – F – F – F – F.
V – V – V – V – V.
V – F – V – F – V.
Código da questão: 50708
Resolução comentada:
Falhas independentes se referem à capacidade que cada componente do sistema distribuído tem em poder falhar
independentemente, sendo que outros componentes podem permanecer em plena atividade porque em sistemas
distribuídos as falhas resultam em isolamento do componente que falhou, ou seja, os componentes que falham ficam
isolados da rede, podendo não parar de funcionar, apenas ficarem isolados.
Resolução comentada:
A abordagem online não é conhecida como abordagem post-mortem, esse termo se refere à abordagem offline. A au
de custo de manutenção de dados é uma das principais características. O custo de manutenção de dados é uma van
porque NÃO há a necessidade de armazenamento de dados em disco. A falta de escalabilidade é uma de suas princ
desvantagens. Uma de suas características é a AUSÊNCIA da necessidade de gravação de informações durante a
execução.
Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde...
3 of 6 21/02/2023 13:48
6)
7)
O termo big data vai além do significado de grande massa de dados. A esse respeito, avalie as afirmativas a seguir.
I. O armazenamento digital de dados no final da segunda década dos anos 2000 é de, praticamente, 90%.
II. No contexto big data, agregar valor representa o retorno esperado do investimento.
III. No contexto de big data, o termo analytics significa o processo de extração de dados.
IV. O conceito de big data analytics é uma combinação de sistemas capazes de tratar dados estruturados e não estrutur
V. Há um conjunto de letras V’s que representam o conceito de big data.
São verdadeiras:
Alternativas:
II - III - IV.
I - III - V.
II - IV - V.  CORRETO
I - II - IV.
I - II.
Código da questão: 50722
Sobre as ferramentas OLAP (processo analítico online), avalie as afirmativas a seguir.
I. A primeira vez que falou no termo OLAP foi em 1992.
II. A linguagem OLAP de definição de dados (DDL) pode remover uma estrutura de dados.
III. A estrutura principal de dados de um data warehouse é conhecida como fatos.
IV. Uma estrutura de dados de um data warehouse, quando pensada como um cubo, se tiver mais de três dimensões é 
como hipercubo.
V. As estruturas auxiliares de um data warehouse são conhecidas como tabelas.
São verdadeiras:
Alternativas:
I - II - IV.
II - III - V.
II - III - IV.  CORRETO
III - IV - V.
IV - V.
Resolução comentada:
O armazenamento digital de dados no final da segunda década dos anos 2000 é de, praticamente, 100%. No contex
data, agregar valor representa o retorno esperado do investimento. No contexto de big data, o termo analytics signific
do processo de extração de dados, pois também cria informações. O conceito de big data analytics é uma combinaçãsistemas capazes de tratar dados estruturados e não estruturados. Há um conjunto de letras V’s que representam o
conceito de big data, volume, variedade, velocidade, veracidade e valor agregado.
Resolução comentada:
Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde...
4 of 6 21/02/2023 13:48
8)
9)
Código da questão: 50732
A respeito de um data warehouse, avalie as asserções a seguir e a relação existente entre elas.
I. A necessidade de uma flexibilidade mínima para um data warehouse se faz necessária.
PORQUE
II. Um data warehouse inflexível implica em restrição aos usuários a realizarem apenas consultas e análises com motiva
vigentes, sem sequer permitir que novos insights sejam implementados (VERZOLA, 201-?).
Referência: VERZOLA, I. Data warehouse. [201-?]. Barueri: Pontes Computadores e Serviços Ltda. Disponível em:
http://www.pontes.inf.br/docs/datawarehouse.pdf. Acesso em: 7 nov. 2019.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
A primeira e a segunda asserção estão corretas, mas a segunda não é justificativa da primeira.
As duas asserções estão incorretas.
A primeira e a segunda asserção estão corretas e a segunda justifica a primeira.  CORRETO
A primeira asserção está incorreta, e a segunda asserção está correta.)
A primeira asserção está correta, e a segunda asserção está incorreta.
Código da questão: 50719
A respeito de otimização de programação R, avalie a afirmativa a seguir para completar suas lacunas corretamente.
Em se tratando de otimização da linguagem R em ____________, estudiosos do assunto afirmam que esta é uma ques
____________, pois, em muitas situações, os programas podem demorar um longo período de tempo para realizar
____________ de algumas tarefas (HÖLBIG; MAZZONETTO; PAVAN, 2017). Por isso, dá-se à otimização uma ampla a
com a intenção de produzir scripts apropriados, que possam otimizar o desempenho computacional do processo.
Referência: HÖLBIG, C. A.; MAZZONETTO, A.; PAVAN, W. Computação paralela com a linguagem R: técnicas, ferrame
aplicações. Minicurso. 17ª Escola Regional de Alto Desempenho do Estado do Rio Grande do Sul. Anais, p. 25-42. Ijuí: 
Disponível em: http://www.lbd.dcc.ufmg.br/colecoes/erad/2017/003.pdf. Acesso em: 29 nov. 2019.
Assinale a alternativa que completa adequadamente as lacunas acima.
Alternativas:
A primeira vez que se falou no termo OLAP foi em 1962. A linguagem OLAP de definição de dados (DDL) pode remo
uma estrutura de dados. A estrutura principal de dados de um data warehouse é conhecida como fatos. Uma estrutu
dados de um data warehouse quando pensada como um cubo, se tiver mais de três dimensões é conhecida como
hipercubo. As estruturas auxiliares de um data warehouse são conhecidas como tabelas.
Resolução comentada:
A necessidade de uma flexibilidade mínima para um data warehouse se faz necessária porque um data warehouse
inflexível implica em restrição aos usuários a realizarem apenas consultas e análises com motivações vigentes, sem 
permitir que novos insights sejam implementados (VERZOLA, 201-?).
Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde...
5 of 6 21/02/2023 13:48
10)
Computadores; fácil; programas.
Processos; fácil; programas.
Computadores; crítica; execução.
Processos; crítica; execução.  CORRETO
Computadores; fácil; execução.
Código da questão: 50726
O uso do processamento paralelo permite que vários processadores sejam utilizados para resolver o mesmo proble
processador resolve uma parte distinta. Os autores Navaux, De Rose e Pilla (2011) listaram uma série de vantagens do 
processamento paralelo. Uma das vantagens surge com a redução do tempo de execução. Qual o nome desta caracter
Referência: NAVAUX, P. O. A.; De ROSE, C. A. F.; PILLA, L. L. Fundamentos das arquiteturas para processamento para
distribuído. 2011. Laboratório de Banco de Dados. Departamento de Ciência da Computação – UFMG. Disponível em:
http://www.lbd.dcc.ufmg.br/colecoes/erad-rs/2011/003.pdf. Acesso em: 17 set. 2019.
Assinale a alternativa CORRETA.
Alternativas:
Crescimento linear.
Modelagem.
Tolerância a falhas.
Desempenho.  CORRETO
Aceleração linear.
Código da questão: 50700
Resolução comentada:
Em se tratando de otimização da linguagem R em processos, estudiosos do assunto afirmam que esta é uma questã
crítica, pois, em muitas situações, os programas podem demorar um longo período de tempo para realizar execução
algumas tarefas.
Resolução comentada:
Navaux, De Rose e Pilla (2011) listam o desempenho como vantagem do uso do processamento paralelo, o qual traz
consequência a redução do tempo de processamento e execução de problemas.
Arquivos e Links
Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde...
6 of 6 21/02/2023 13:48

Continue navegando