Buscar

Infraestrutura de Data Science e Cloud Computing AV2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Infraestrutura de Data Science e Cloud Computing AV2
Conteúdo do exercício
1. Pergunta 1
0,5/0,5
A computação em nuvem lançou mão de muitas tecnologias para oferecer serviços profissionais, além de ter desenvolvido novas soluções. Uma dessas soluções são os chamados “contêineres”, que facilitam o crescimento de forma gerenciada de aplicações, aumentando o poder de escalonamento vertical e horizontal.
A partir dessas informações e do conteúdo estudado em relação a contêineres e máquinas virtuais tradicionais, é possível, ao compará-los, afirmar que:
Ocultar opções de resposta 
1. 
Os contêineres são exatamente iguais às máquinas virtuais.
2. 
Em relação às máquinas virtuais, os contêineres facilitam a administração de aplicações somente para novas aplicações desenvolvidas com esses recursos.
3. 
Os contêineres exigem configuração e mudança específica para cada tipo de ampliação de uso pela aplicação, diferentemente das máquinas virtuais.
4. 
Assim como as máquinas virtuais, os contêineres exigem que o sistema operacional seja dedicado, evitando problemas de configuração.
5. 
Correta: Assim como as máquinas virtuais, os contêineres não dependem da virtualização de hardware e economizam recursos como o sistema operacional.
Resposta correta
2. Pergunta 2
0,5/0,5
O Cloud Computing possibilitou a oferta de vários tipos de serviços, desde aplicações prontas, como CRM, ERP ou Business Intelligence para o uso imediato, até componentes específicos de infraestrutura, que exigiriam investimentos grandes e até adequação de data center para conter equipamentos mais sofisticados.
Considerando as informações apresentadas e os conteúdos estudados, relacione as soluções apresentadas a seguir ao tipo de serviço de Cloud Computing referente a cada uma.
1) IaaS – Infrastructure as a Service.
2) SaaS – Software as a Service.
3) PaaS – Platform as a Service.
( ) Ferramenta de Business Intelligence que permite a realização de análises, visualização de dashboard, relatórios e indicadores online através de web browser.
( ) Ambiente de desenvolvimento de aplicações com bibliotecas de Machine Learning, recursos de controle de versão, integração com banco de dados e facilidades de criação de contêineres, gestão de acessos e segurança.
( ) Ambiente virtualizado com capacidade de processamento matemático com alta velocidade (GPU), memória RAM de grandes volumes, discos SSD para conter dados de treinamento de modelos de Machine Learning.
Assinale a alternativa com a ordem correta:
Ocultar opções de resposta 
1. 
3, 2, 1.
2. 
Correta: 2, 3, 1.
Resposta correta
3. 
1, 3, 2.
4. 
3, 1, 2.
5. 
2, 1, 3.
3. Pergunta 3
0,5/0,5
O Databricks é uma distribuição de plataforma de Data Science em Cloud que usa recursos dos provedores de cloud, tais como Amazon Web Services (AWS) e Microsoft Azure.
Considerando essas informações e o conteúdo estudado, pode-se afirmar que o principal diferencial do Databricks é o fato de que:
Ocultar opções de resposta 
1. 
Correta: o Databricks facilita a implantação de estruturas automatizadas de criação e manutenção de Machine Learning, com velocidade superior ao Spark.
Resposta correta
2. 
o Databricks possui recursos de integração ou outras linguagens de programação.
3. 
o Databricks possui o diferencial de utilização de cluster de grande desempenho.
4. 
o Databricks possui recursos de utilização de bibliotecas de Machine Learning.
5. 
o Databricks possui recursos de notebooks para análise de dados.
4. Pergunta 4
0,5/0,5
Os bancos de dados NoSQL são bancos de dados que não utilizam os padrões tradicionais de estruturas de tabelas e esquemas pré-definidos de uso dos dados. Com o crescimento da Internet, se tornaram uma ótima opção em função da escalabilidade e flexibilidade de uso.
Assim, considerando as informações apresentadas e os conteúdos estudados, analise as características dos bancos de dados NoSQL e a seguir e associe-as com suas respectivas descrições.
1) Isolation (Isolamento).
2) Durability (durabilidade).
3) Atomicity (atomicidade).
4) Consistency (consistência).
( ) O resultado de uma transação executada até o fim tem que gerar um estado íntegro.
( ) Uma transação, mesmo quando envolve várias entidades, tem que completar-se até seu final sem erros.
( ) Durante uma transação, ela não deve afetar outras e nem ser afetada por outras até que termine.
( ) Manter o registro dos dados em um estado correto mesmo após falhas.
Assinale a alternativa com a relação correta:
Ocultar opções de resposta 
1. 
Correta: 4, 3, 1, 2.
Resposta correta
2. 
1, 4, 2, 3.
3. 
4, 1, 2, 3.
4. 
3, 1, 2, 4.
5. 
2, 1, 3, 4.
5. Pergunta 5
0,5/0,5
A área de Data Science é a que mais está evoluindo no mundo dos negócios nos últimos anos, e muitas soluções estão sendo aplicadas em diferentes tipos de mercado. Na área de medicina, soluções estão fazendo diagnósticos com precisão idêntica a especialistas, e na área de advocacia há consultores virtuais que podem identificar rapidamente as abordagens jurídicas adequadas.
A partir dessas informações e do conteúdo estudado, pode-se afirmar que a estratégia mais adequada, mesmo após a adoção de Cloud Computing, é: 
Ocultar opções de resposta 
1. 
Manter o foco nas soluções iniciais, pois os fornecedores sempre atualizam as suas versões, ajustando os Roadmaps entre si.
2. 
Correta: Manter uma área de estudos que crie projetos pilotos em novas tecnologias de forma experimental, para possíveis ajustes no Roadmap.
Resposta correta
3. 
Devido à grande concorrência e ao risco de mudanças no mercado, deve-se criar uma equipe dedicada a desenvolver as tecnologias necessárias.
4. 
Manter uma área de testes com investimentos em novos equipamentos, novos softwares, mesmo que isso signifique substituição.
5. 
Sempre contratar novos funcionários com experiências em novas plataformas, mantendo a equipe renovada.
6. Pergunta 6
0,5/0,5
O ecossistema do Apache Hadoop conta com uma infraestrutura de processamento distribuído chamado de Storm. Seu objetivo é melhorar o tratamento de fluxo de dados, melhorando os resultados de aplicações em tempo real.
Assim como o Spark, o Storm processa fluxos de dados. Considerando essas informações e o conteúdo estudado, pode-se afirmar que a principal diferença entre o Spark e o Storm é o fato de que:
Ocultar opções de resposta 
1. 
o Spark é mais indicado para processamento de fluxos de dados em tempo real, enquanto o Storm é mais indicado para arquivos batches.
2. 
o Storm é uma solução de processamento de fluxos de dados, que usa a linguagem Scala, enquanto o Spark usa a linguagem de programação Java.
3. 
o Storm é mais indicado para processamento de Machine Learning, visto que possui bibliotecas especializadas, enquanto o Spark se especializou em banco de dados de grafos, o GraphX.
4. 
o Spark é mais indicado para processamento de fluxos de dados para ETL, enquanto o Storm é mais indicado para fluxos de processamento de Machine Learning.
5. 
Correta: o Storm separa o processamento e distribui entre os nós do cluster em paralelo, enquanto o Spark distribui o mesmo processamento entre os nós.
Resposta correta
7. Pergunta 7
0,5/0,5
O Spark possui uma forma de integração nativa com algumas das mais usadas linguagens de programação, facilitando a sua utilização de forma mais rápida. Isso permite a criação de soluções customizadas com maior velocidade disponibilidade de recursos humanos no mercado.
Assinale a alternativa que possua somente linguagens com suporte nativo no Spark:
Ocultar opções de resposta 
1. 
Scala, Java, ObjectiveC, Pascal e R.
2. 
TypeScript, C, JavaScript, ObjectiveC e Pascal.
3. 
Scala, C, Python, R e TypeScript.
4. 
Python, Scala, Java, Basic e Pascal.
5. 
Correta: Scala, Java, Python, SQL e R.
Resposta correta
8. Pergunta 8
0,5/0,5
A solução comercial Cloudera usa como base o ecossistema do Apache Hadoop em suas soluções, ampliando a solução com novas características, suporte estendido, certificação de especialistas, e mais recentemente está ampliando ainda mais sua estratégia em Cloud Computing.
Assinale a alternativa que contenha somente oscomponentes do ecossistema do Apache Hadoop que estão na distribuição Cloudera:
Ocultar opções de resposta 
1. 
HDFS, Spark, Java, Forrest e Kafka.
2. 
Correta: HDFS, Spark, Impala, Kudu, HBase e Kafka.
Resposta correta
3. 
HDFS, Spark, Ambari, Forrest e HBase.
4. 
Forrest, HDFS, Impala, Java e TensorFlow
5. 
Forrest, HDFS, Impala, HBase e Kafka.
9. Pergunta 9
0,5/0,5
O Spark possui uma estrutura de banco de dados NoSQL chamado GraphX, a fim de acelerar o processamento de dados não relacionais. O uso de bancos de dados que usa o relacionamento do tipo grafos é específico para alguns tipos de necessidades de negócio. Saber aplicá-los pode acelerar o processamento de dados não estruturados. 
Considerando essas informações e o conteúdo estudado, pode-se afirmar que o Spark GraphX é mais indicado para:
Ocultar opções de resposta 
1. 
criação de modelos de Machine Learning, que calculam preços baseados em comportamento.
2. 
Correta: criação de estrutura de dados em forma de grafos, como link de páginas-web, por exemplo.
Resposta correta
3. 
criação de soluções de visualização de dados em 3D para analisar dados e para efetuar regressões não lineares.
4. 
criação de soluções mais eficientes, tirando proveito de tabelas em SQL e ampliando a utilização de outras ferramentas.
5. 
criação de estrutura de visualização de dados gráficos para o entendimento melhorado das informações.
10. Pergunta 10
0,5/0,5
O Hadoop, apesar de ser uma solução open Source, é a base de muitas outras soluções comerciais do mercado, tais como Cloudera, Hortonworks e MapR. Muitas empresas preferem esses pacotes aos de solução Open Source.
Considerando essas informações e o conteúdo estudado, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s):
I. ( ) A solução Open Source do Hadoop é incompleta, o que faz com que as empresas prefiram soluções comerciais com clientes em operação.
II. ( ) A solução Open Source do Hadoop exige a adição de mais qualidades para ser usada em operações críticas em produção.
III. ( ) O suporte às soluções empresariais necessitam de um tempo de solução mais curto e previsível e em horários estendidos (24x7, por exemplo), o que é mais difícil de ser obtido por comunidades de usuários.
IV. ( ) Os pacotes comerciais trazem componentes adicionais de integração com outras plataformas, bem como ferramentas de gestão que aceleram a implantação e a recuperação de investimentos.
Agora, assinale a alternativa que apresenta a sequência correta:
Ocultar opções de resposta 
1. 
Correta: F, F, V, V.
Resposta correta
2. 
F, V, V, V.
3. 
V, V, F, F.
4. 
F, V, F, V.
5. 
V, F, V, F.

Continue navegando