Buscar

AV 2 - Infraestrura de Ciência de Dados e Computação em nuvem

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

AV 2  Infraestrutura de Ciência de dados e Computação em nuvem 
1. Pergunta 1
0/0,5
As soluções Open Source estão se tornando cada vez mais populares e estão sendo adotadas por grandes empresas. No entanto, apesar disso, ainda há muitas restrições do seu uso no meio corporativo, muitas vezes com base em razões claras, e outras por falta de conhecimento mais específico.
Considerando essas informações, pode-se afirmar que as empresas ainda têm restrições no uso de ferramentas Open Source, porque:
as soluções Open Source não possuem serviços de suporte comercial, deixando para o mercado definir sua própria estratégia, contratando outras empresas para isso ou criando sua própria área de suporte com equipe especializada.
os custos escondidos de propriedade TCO das soluções Open Source geram a inviabilidade do seu cálculo e o uso por parte das corporações fica inviável.
empresas acreditam que o Open Source não tem a qualidade necessária para o uso corporativo, a despeito dessas soluções possuírem um suporte totalmente adequado aos padrões de mercado.
há grande preocupação com segurança, considerando que é possível ter acesso aos códigos fonte, ficando mais fácil criar ou encontrar vulnerabilidades que comprometam a solução.
a propriedade intelectual dos softwares Open Source preocupa as corporações, visto que, no início, não existe custos grandes, mas o risco de aplicabilidade de multas dos que o usam torna a sua adoção mais restrita.
2. Pergunta 2
0,5/0,5
A flexibilidade gerada pela virtualização de máquinas facilitou o aproveitamento de recursos de hardware. É mais vantajoso realizar o investimento em servidores com maior capacidade e dividi-lo entre serviços diferentes, conforme a necessidade.
De acordo com o texto-base e os conteúdos estudados, é possível afirmar que o componente responsável por gerenciar os recursos físicos entre os servidores virtualizados é o:
Hardware de Servidor.
Servidor Virtual.
Sistema Operacional Hypervisor.
Roteadores e Switches.
Sistema Operacional.
3. Pergunta 3
0,5/0,5
O Cloud Computing possibilitou a oferta de vários tipos de serviços, desde aplicações prontas, como CRM, ERP ou Business Intelligence para o uso imediato, até componentes específicos de infraestrutura, que exigiriam investimentos grandes e até adequação de data center para conter equipamentos mais sofisticados.
Considerando as informações apresentadas e os conteúdos estudados, relacione as soluções apresentadas a seguir ao tipo de serviço de Cloud Computing referente a cada uma.
1) IaaS – Infrastructure as a Service.
2) SaaS – Software as a Service.
3) PaaS – Platform as a Service.
( ) Ferramenta de Business Intelligence que permite a realização de análises, visualização de dashboard, relatórios e indicadores online através de web browser.
( ) Ambiente de desenvolvimento de aplicações com bibliotecas de Machine Learning, recursos de controle de versão, integração com banco de dados e facilidades de criação de contêineres, gestão de acessos e segurança.
( ) Ambiente virtualizado com capacidade de processamento matemático com alta velocidade (GPU), memória RAM de grandes volumes, discos SSD para conter dados de treinamento de modelos de Machine Learning.
Assinale a alternativa com a ordem correta:
2, 3, 1.
2, 1, 3.
3, 2, 1.
1, 3, 2.
3, 1, 2.
4. Pergunta 4
0/0,5
A computação em nuvem lançou mão de muitas tecnologias para oferecer serviços profissionais, além de ter desenvolvido novas soluções. Uma dessas soluções são os chamados “contêineres”, que facilitam o crescimento de forma gerenciada de aplicações, aumentando o poder de escalonamento vertical e horizontal.
A partir dessas informações e do conteúdo estudado em relação a contêineres e máquinas virtuais tradicionais, é possível, ao compará-los, afirmar que:
Os contêineres exigem configuração e mudança específica para cada tipo de ampliação de uso pela aplicação, diferentemente das máquinas virtuais.
Assim como as máquinas virtuais, os contêineres exigem que o sistema operacional seja dedicado, evitando problemas de configuração.
Assim como as máquinas virtuais, os contêineres não dependem da virtualização de hardware e economizam recursos como o sistema operacional.
Em relação às máquinas virtuais, os contêineres facilitam a administração de aplicações somente para novas aplicações desenvolvidas com esses recursos.
Os contêineres são exatamente iguais às máquinas virtuais.
5. Pergunta 5
0/0,5
O ecossistema do Apache Hadoop conta com uma infraestrutura de processamento distribuído chamado de Storm. Seu objetivo é melhorar o tratamento de fluxo de dados, melhorando os resultados de aplicações em tempo real.
Assim como o Spark, o Storm processa fluxos de dados. Considerando essas informações e o conteúdo estudado, pode-se afirmar que a principal diferença entre o Spark e o Storm é o fato de que:
o Storm é mais indicado para processamento de Machine Learning, visto que possui bibliotecas especializadas, enquanto o Spark se especializou em banco de dados de grafos, o GraphX.
o Storm é uma solução de processamento de fluxos de dados, que usa a linguagem Scala, enquanto o Spark usa a linguagem de programação Java.
o Spark é mais indicado para processamento de fluxos de dados em tempo real, enquanto o Storm é mais indicado para arquivos batches.
o Storm separa o processamento e distribui entre os nós do cluster em paralelo, enquanto o Spark distribui o mesmo processamento entre os nós.
o Spark é mais indicado para processamento de fluxos de dados para ETL, enquanto o Storm é mais indicado para fluxos de processamento de Machine Learning.
6. Pergunta 6
0/0,5
As soluções híbridas de cloud Computing e serviços on premises (nas instalações das empresas) tornaram-se o padrão de mercado devido à facilidade de utilização dos benefícios das duas formas de trabalho.
Considerando as informações e o conteúdo estudado a respeito da implantação de soluções para Data Science, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s).
I. ( ) Os appliances são equipamentos que podem ser colocados nos data center das empresas para facilitar a integração de dados com os provedores de Cloud Computing.
II. ( ) A área de Data Science deve desenvolver sua própria estratégia de Cloud Computing, independente de outras áreas da corporação.
III. ( ) A migração para Cloud Computing deve começar com a implantação do Data Lake para a empresa.
IV. ( ) A utilização de soluções corporativas como o Hadoop em cloud deve prever no mínimo a utilização por longos períodos, reduzindo os custos em Cloud por demanda.
Assinale a alternativa com a sequência correta:
V, F, F, V.
F, V, F, V.
V, V, F, V.
V, F, V, F.
V, F, V, V.
7. Pergunta 7
0,5/0,5
As soluções em Cloud, como SaaS e PaaS, estão sendo usadas diretamente por alguns departamentos nas grandes empresas, e muitas vezes não estão sendo geridas pela área de TI. Esse fenômeno pode ser explicado pela facilidade de contratação do Cloud e pelo fato de ser um tipo de solução mais rápida que os processos internos de alocação de recursos da área tecnologia das empresas.
A partir dessas informações e do conteúdo estudado a respeito da complexidade de gestão de soluções em Cloud, é correto afirmar que:
A burocracia é criada pelos provedores de soluções de cloud em relação à alocação de recurso computacionais.
A complexidade da gestão de preços em cloud é mínima, por existirem preços padronizados independentes da forma de uso, dispensando gestão específica.
O tempo de alocação dos recursos nas soluções em cloud torna mais complicada a gestão de demandas por parte dos usuários.
Com a facilidade de alocação dos recursos, torna-se um desafio o controle financeiro do que está sendo realmente gasto.
Os provedores de cloud possuem um portfólio de serviços bem organizado e dispensam outras formas de controle externo.
8. Pergunta 8
0,5/0,5
As empresas estão adotando uma estratégia MultiCloud, isto é, mais que um fornecedor de soluções de cloud Computing para os seus negócios. Em parte, este fenômeno tem ocorrido pela gama de soluçõesprontas para alguns departamentos específicos, tais como RH ou finanças.
Em relação à estratégia MultiCloud, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s).
I. ( ) Apesar de existir certa compatibilidade de migração de componentes de serviço entre os provedores de Cloud Computing, os custos que podem ser economizados não compensam.
II. ( ) Há uma procura crescente por ferramentas que automatizam a gestão de custos entre provedores de Cloud, facilitando a tomada de decisão de uso entre os concorrentes.
III. ( ) As ferramentas de gestão MultiCloud também analisam o comportamento das aplicações e sugerem alocação diferenciada no mesmo provedor com o intuito de redução de custos.
IV. ( ) As ferramentas de gestão MultiCloud servem para analisar a ociosidade dos recursos alocados, sugerindo consolidações e melhoria de consumo por investimento gasto.
Agora, assinale a alternativa que apresenta a sequência correta:
Correta: 
F, V, V, V.
F, F, V, V.
V, F, V, F.
V, V, F, V.
F, V, F, F.
9. Pergunta 9
0/0,5
Uma empresa de varejo possui lojas de moda feminina e quer aumentar a previsibilidade de estoques nas épocas de maior demanda: dia das mães, Black Friday, e Natal. Foi criado um projeto de Data Science que precisa de muito processamento por três semanas, a ser realizado dois meses antes destas datas, e se conecta com os sistemas de ERP em seu data center.
A partir dessas informações e do conteúdo estudado, é correto dizer que a denominação do tipo de Cloud Computing mais adequado e o motivo de utilização da situação descrita são, respectivamente: 
Community Cloud, para que se possa manter os recursos comuns das aplicações de e-commerce sempre disponíveis, mesmo fora da estação de maior movimento. 
Hybrid Cloud, para manter os recursos de uso normal durante os períodos fora do pico. Nos momentos de maior demanda utilizar Cloud Computing.
Private Cloud, para poder ter controle de acesso às informações, impedindo que hackers e concorrentes tenham acesso às informações de estoque.
Dedicated Cloud, para poder ter controle de acesso às informações, impedindo que hackers e concorrentes tenham acesso às informações de estoque.
Public Cloud, para poder usar os recursos de Data Science existentes em nuvem, tendo que migrar também suas aplicações de ERP para nuvem.
10. Pergunta 10
0,5/0,5
A combinação do Spark com o Hadoop se torna altamente flexível e responsiva para diferentes tipos de aplicações da data Science, sendo usada por empresas como Netflix, Twitter e Apple.
Assim, considerando as informações apresentadas e os conteúdos estudados, analise as técnicas disponíveis a seguir e associe-as com suas respectivas características:
1) Spark.
2) Hadoop.
( ) Utilização da memória compartilhada entre os cluster de forma mais eficaz.
( ) Executa os jobs que precisam de dados em quantidades maiores que a memória compartilhada do cluster.
( ) Executa os jobs usando mecanismo DAG (Direct Acyclic Graph), que pode executar tarefas mais complexas e mais rápidas.
( ) Responsável pelo sistema de arquivos em cluster, da alta capacidade, com replicação e velocidade.
( ) Executa o processamento de streaming e pipeline de dados usados por processos de ETL.
Agora, assinale a alternativa que apresenta a sequência correta:
Ocultar opções de resposta 
2, 1, 2, 1, 2.
1, 1, 1, 2, 1.
1, 2, 1, 2, 1.
1, 2, 1, 1, 1.
1, 2, 2, 2, 1.
Pergunta 11
0,5/0,5
A solução comercial Cloudera usa como base o ecossistema do Apache Hadoop em suas soluções, ampliando a solução com novas características, suporte estendido, certificação de especialistas, e mais recentemente está ampliando ainda mais sua estratégia em Cloud Computing.
Assinale a alternativa que contenha somente os componentes do ecossistema do Apache Hadoop que estão na distribuição Cloudera:
Ocultar opções de resposta 
Forrest, HDFS, Impala, Java e TensorFlow
HDFS, Spark, Impala, Kudu, HBase e Kafka.
Forrest, HDFS, Impala, HBase e Kafka.
HDFS, Spark, Ambari, Forrest e HBase.
Pergunta 12
0/0,5
O mercado de soluções de cloud está crescendo cada vez mais, os grandes fornecedores estão buscando mercado e ampliando a gama de clientes com funcionalidades mais práticas, com o uso de bibliotecas e algoritmos avançados.
Assim, considerando as informações apresentadas e os conteúdos estudados, analise as técnicas disponíveis a seguir e associe-as com suas respectivas características:
1) Reduz a dependência de bibliotecas de Machine Learning e armazenamento.
2) Dificulta a migração entre fornecedores de cloud.
3) Protege o desenvolvimento de aplicações e modelos customizados.
( ) Usar os tipos de armazenamentos específicos: local com HDFS, AWS S3, GSC – Google Cloud Storage, ADLS (Azure Data Lake Storage).
( ) Uso de Kubernetes para a carga de trabalho e aplicações desenvolvidas, permitindo a utilização de algoritmos desenvolvidos ou acessos a outras APIs.
( ) Utilizar a combinação de Hadoop + Spark (HARK) para as soluções de Data Science, bem como a integração de API e algoritmos de código aberto.
( ) Utilizar soluções que aumentam a produtividade na criação de soluções de Data Science e utilizam GPU da NVIDIA, tais como: AI Platform da Google, Machine Learning Studio da Microsoft ou StageMaker da Amazon. 
Agora, assinale a alternativa que apresenta a sequência correta:
3, 1, 2, 3.
3, 2, 1, 2
2, 3, 1, 2.
1, 3, 2, 2.
2, 1, 2, 3.
Pergunta 13
0,5/0,5
A solução comercial Hortonworks de Data Science, assim como a Cloudera, usa como base muitos componentes do ecossistema do Apache Hadoop em suas soluções. Seu principal foco é a compatibilidade de armazenamento em cloud e o suporte a contêineres. 
Assinale a alternativa que contenha somente os componentes contidos no Hortonworks:
Ocultar opções de resposta 
HDFS, HBase, Pytorch, CouchDB e Storm.
HDFS, Spark, Forrest, CouchDB e Kafka.
HDFS, Spark, TensorFlow, Kafka e Storm.
HDFS, Spark, Pytorch, Kafka e Storm.
HDFS, Spark, TensorFlow, Forrest e Storm.
Pergunta 14
0,5/0,5
A Apache tem ampliado e aprimorado o framework do Hadoop e continua desenvolvendo soluções para a plataforma, adequando-se às diferentes necessidades corporativas. Uma dessas soluções é o Apache Tez, que ajuda a melhorar o seu desempenho.
Considerando essas informações e o conteúdo estudado, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s):
I. ( ) O Apache Tez gera uma gestão mais eficaz do MapReduce.
II. ( ) O Apache Tez gera melhoria na capacidade do HDFS para arquivos maiores.
III. ( ) O Apache Tez implementa a estratégia de DAG (Direct Acyclic Graph) no Hadoop.
IV. ( ) O Apache Tez permite a execução de jobs na memória compartilhada do cluster Hadoop.
Assinale a alternativa que apresenta a sequência correta:
F, V, F, V.
V, F, F, F.
V, F, F, V.
V, F, V, F.
V, V, F, F.
Pergunta 15
0,5/0,5
O Apache Hadoop, ainda conta com uma gama se soluções comerciais que se utilizam dele como plataforma base, e adicionam vários recursos de gestão, integração, aumentando o dinamismo da ferramenta, que no caso do Hadoop é Ope Source, sendo suportado por organizações e outras empresas de mercado.
Considerando essas informações e o conteúdo estudado, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s):
I. ( ) A vantagem do uso de solução Open Source se dá em função do menor investimento em licenças de software e a possibilidade de customização da solução em nível de código.
II. ( ) As soluções Open Source permitem redução dos custos totais (TCO) devido ao suporte da comunidade de usuários ser suficiente para qualquer necessidade corporativa.
III. ( ) As soluções Open Source contam com o suporte da comunidade de desenvolvedores, não sofrendo pressões de estratégias comerciais ou aquisições entre empresas.
IV. ( ) O desenvolvimento próprio de integrações específicas usando Open Source é inviável, como, por exemplo, empresas de saúde integrarem com equipamentos de diagnóstico.
A seguir, assinale a alternativa que apresenta a sequência correta:
V, F, V, F.
V, F, F, V.
F, V, V, F
F,F, V, F
F, V, F, V.
Pergunta 16
0,5/0,5
A combinação do Spark com o Hadoop se torna altamente flexível e responsiva para diferentes tipos de aplicações da data Science, sendo usada por empresas como Netflix, Twitter e Apple.
Assim, considerando as informações apresentadas e os conteúdos estudados, analise as técnicas disponíveis a seguir e associe-as com suas respectivas características:
1) Spark.
2) Hadoop.
( ) Utilização da memória compartilhada entre os cluster de forma mais eficaz.
( ) Executa os jobs que precisam de dados em quantidades maiores que a memória compartilhada do cluster.
( ) Executa os jobs usando mecanismo DAG (Direct Acyclic Graph), que pode executar tarefas mais complexas e mais rápidas.
( ) Responsável pelo sistema de arquivos em cluster, da alta capacidade, com replicação e velocidade.
( ) Executa o processamento de streaming e pipeline de dados usados por processos de ETL.
Agora, assinale a alternativa que apresenta a sequência correta:
Ocultar opções de resposta 
1, 1, 1, 2, 1.
2, 1, 2, 1, 2.
1, 2, 2, 2, 1.
1, 2, 1, 1, 1.
1, 2, 1, 2, 1.

Continue navegando

Outros materiais