Buscar

Pos_ data science

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

1. Pergunta 1 
0,5/0,5 
A solução comercial Cloudera usa como base o ecossistema do Apache Hadoop em suas 
soluções, ampliando a solução com novas características, suporte estendido, 
certificação de especialistas, e mais recentemente está ampliando ainda mais sua 
estratégia em Cloud Computing. 
Assinale a alternativa que contenha somente os componentes do ecossistema do 
Apache Hadoop que estão na distribuição Cloudera: 
Ocultar opções de resposta 
Forrest, HDFS, Impala, Java e TensorFlow 
HDFS, Spark, Impala, Kudu, HBase e Kafka. Resposta correta 
Forrest, HDFS, Impala, HBase e Kafka. 
HDFS, Spark, Ambari, Forrest e HBase. 
HDFS, Spark, Java, Forrest e Kafka. 
2. Pergunta 2 
0/0,5 
O mercado de soluções de cloud está crescendo cada vez mais, os grandes 
fornecedores estão buscando mercado e ampliando a gama de clientes com 
funcionalidades mais práticas, com o uso de bibliotecas e algoritmos avançados. 
Assim, considerando as informações apresentadas e os conteúdos estudados, analise 
as técnicas disponíveis a seguir e associe-as com suas respectivas características: 
1) Reduz a dependência de bibliotecas de Machine Learning e armazenamento. 
2) Dificulta a migração entre fornecedores de cloud. 
3) Protege o desenvolvimento de aplicações e modelos customizados. 
( ) Usar os tipos de armazenamentos específicos: local com HDFS, AWS S3, GSC – 
Google Cloud Storage, ADLS (Azure Data Lake Storage). 
( ) Uso de Kubernetes para a carga de trabalho e aplicações desenvolvidas, permitindo 
a utilização de algoritmos desenvolvidos ou acessos a outras APIs. 
( ) Utilizar a combinação de Hadoop + Spark (HARK) para as soluções de Data Science, 
bem como a integração de API e algoritmos de código aberto. 
( ) Utilizar soluções que aumentam a produtividade na criação de soluções de Data 
Science e utilizam GPU da NVIDIA, tais como: AI Platform da Google, Machine Learning 
Studio da Microsoft ou StageMaker da Amazon. 
Agora, assinale a alternativa que apresenta a sequência correta: 
Ocultar opções de resposta 
3, 1, 2, 3. 
3, 2, 1, 2 
2, 3, 1, 2. Resposta correta 
1, 3, 2, 2. 
 
2, 1, 2, 3. 
3. Pergunta 3 
0,5/0,5 
A solução comercial Hortonworks de Data Science, assim como a Cloudera, usa como 
base muitos componentes do ecossistema do Apache Hadoop em suas soluções. Seu 
principal foco é a compatibilidade de armazenamento em cloud e o suporte a 
contêineres. 
Assinale a alternativa que contenha somente os componentes contidos no 
Hortonworks: 
Ocultar opções de resposta 
HDFS, HBase, Pytorch, CouchDB e Storm. 
HDFS, Spark, Forrest, CouchDB e Kafka. 
HDFS, Spark, TensorFlow, Kafka e Storm. Correta 
HDFS, Spark, Pytorch, Kafka e Storm. 
HDFS, Spark, TensorFlow, Forrest e Storm. 
4. Pergunta 4 
0,5/0,5 
A Apache tem ampliado e aprimorado o framework do Hadoop e continua 
desenvolvendo soluções para a plataforma, adequando-se às diferentes necessidades 
corporativas. Uma dessas soluções é o Apache Tez, que ajuda a melhorar o seu 
desempenho. 
Considerando essas informações e o conteúdo estudado, analise as afirmativas a seguir 
e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s): 
I. ( ) O Apache Tez gera uma gestão mais eficaz do MapReduce. 
II. ( ) O Apache Tez gera melhoria na capacidade do HDFS para arquivos maiores. 
III. ( ) O Apache Tez implementa a estratégia de DAG (Direct Acyclic Graph) no Hadoop. 
IV. ( ) O Apache Tez permite a execução de jobs na memória compartilhada do cluster 
Hadoop. 
Assinale a alternativa que apresenta a sequência correta: 
Ocultar opções de resposta 
F, V, F, V. 
V, F, F, F. 
V, F, F, V. 
V, F, V, F. Correta 
V, V, F, F. 
5. Pergunta 5 
0,5/0,5 
As soluções em Cloud, como SaaS e PaaS, estão sendo usadas diretamente por alguns 
departamentos nas grandes empresas, e muitas vezes não estão sendo geridas pela 
área de TI. Esse fenômeno pode ser explicado pela facilidade de contratação do Cloud e 
pelo fato de ser um tipo de solução mais rápida que os processos internos de alocação 
de recursos da área tecnologia das empresas. 
A partir dessas informações e do conteúdo estudado a respeito da complexidade de 
gestão de soluções em Cloud, é correto afirmar que: 
Ocultar opções de resposta 
A burocracia é criada pelos provedores de soluções de cloud em relação à alocação de 
recurso computacionais. 
Os provedores de cloud possuem um portfólio de serviços bem organizado e 
dispensam outras formas de controle externo. 
O tempo de alocação dos recursos nas soluções em cloud torna mais complicada a 
gestão de demandas por parte dos usuários. 
A complexidade da gestão de preços em cloud é mínima, por existirem preços 
padronizados independentes da forma de uso, dispensando gestão específica. 
 
Com a facilidade de alocação dos recursos, torna-se um desafio o controle 
financeiro do que está sendo realmente gasto. Correta 
6. Pergunta 6 
0/0,5 
A computação em nuvem lançou mão de muitas tecnologias para oferecer serviços 
profissionais, além de ter desenvolvido novas soluções. Uma dessas soluções são os 
chamados “contêineres”, que facilitam o crescimento de forma gerenciada de 
aplicações, aumentando o poder de escalonamento vertical e horizontal. 
A partir dessas informações e do conteúdo estudado em relação a contêineres e 
máquinas virtuais tradicionais, é possível, ao compará-los, afirmar que: 
Ocultar opções de resposta 
Em relação às máquinas virtuais, os contêineres facilitam a administração de 
aplicações somente para novas aplicações desenvolvidas com esses recursos. 
Os contêineres exigem configuração e mudança específica para cada tipo de ampliação 
de uso pela aplicação, diferentemente das máquinas virtuais. 
Os contêineres são exatamente iguais às máquinas virtuais. 
 
Assim como as máquinas virtuais, os contêineres exigem que o sistema operacional 
seja dedicado, evitando problemas de configuração. 
Assim como as máquinas virtuais, os contêineres não dependem da virtualização 
de hardware e economizam recursos como o sistema operacional. CORRETA 
7. Pergunta 
0,5/0,5 
O Apache Hadoop, ainda conta com uma gama se soluções comerciais que se utilizam 
dele como plataforma base, e adicionam vários recursos de gestão, integração, 
aumentando o dinamismo da ferramenta, que no caso do Hadoop é Ope Source, sendo 
suportado por organizações e outras empresas de mercado. 
Considerando essas informações e o conteúdo estudado, analise as afirmativas a seguir 
e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s): 
I. ( ) A vantagem do uso de solução Open Source se dá em função do menor 
investimento em licenças de software e a possibilidade de customização da solução em 
nível de código. 
II. ( ) As soluções Open Source permitem redução dos custos totais (TCO) devido ao 
suporte da comunidade de usuários ser suficiente para qualquer necessidade 
corporativa. 
III. ( ) As soluções Open Source contam com o suporte da comunidade de 
desenvolvedores, não sofrendo pressões de estratégias comerciais ou aquisições entre 
empresas. 
IV. ( ) O desenvolvimento próprio de integrações específicas usando Open Source é 
inviável, como, por exemplo, empresas de saúde integrarem com equipamentos de 
diagnóstico. 
A seguir, assinale a alternativa que apresenta a sequência correta: 
Ocultar opções de resposta 
Correta: 
V, F, V, F. 
V, F, F, V. 
F, V, V, F 
F, F, V, F 
F, V, F, V. 
8. Pergunta 8 
0,5/0,5 
As soluções Open Source estão se tornando cada vez mais populares e estão sendo 
adotadas por grandes empresas. No entanto, apesar disso, ainda há muitas restrições 
do seu uso no meio corporativo, muitas vezes com base em razões claras, e outras por 
falta de conhecimento mais específico. 
Considerando essas informações, pode-se afirmar que as empresas ainda têm 
restrições no uso de ferramentas Open Source, porque: 
Ocultar opções de resposta 
empresas acreditam que o Open Source não tem a qualidade necessária para o uso 
corporativo, a despeito dessas soluções possuírem um suporte totalmente adequado 
aos padrões de mercado.há grande preocupação com segurança, considerando que é possível ter acesso aos 
códigos fonte, ficando mais fácil criar ou encontrar vulnerabilidades que 
comprometam a solução. 
a propriedade intelectual dos softwares Open Source preocupa as corporações, visto 
que, no início, não existe custos grandes, mas o risco de aplicabilidade de multas dos 
que o usam torna a sua adoção mais restrita. 
 
as soluções Open Source não possuem serviços de suporte comercial, deixando 
para o mercado definir sua própria estratégia, contratando outras empresas 
para isso ou criando sua própria área de suporte com equipe especializada. 
CORRETA 
os custos escondidos de propriedade TCO das soluções Open Source geram a 
inviabilidade do seu cálculo e o uso por parte das corporações fica inviável. 
9. Pergunta 9 
0,5/0,5 
O Cloud Computing possibilitou a oferta de vários tipos de serviços, desde aplicações 
prontas, como CRM, ERP ou Business Intelligence para o uso imediato, até 
componentes específicos de infraestrutura, que exigiriam investimentos grandes e até 
adequação de data center para conter equipamentos mais sofisticados. 
Considerando as informações apresentadas e os conteúdos estudados, relacione as 
soluções apresentadas a seguir ao tipo de serviço de Cloud Computing referente a cada 
uma. 
1) IaaS – Infrastructure as a Service. 
2) SaaS – Software as a Service. 
3) PaaS – Platform as a Service. 
( ) Ferramenta de Business Intelligence que permite a realização de análises, 
visualização de dashboard, relatórios e indicadores online através de web browser. 
( ) Ambiente de desenvolvimento de aplicações com bibliotecas de Machine Learning, 
recursos de controle de versão, integração com banco de dados e facilidades de criação 
de contêineres, gestão de acessos e segurança. 
( ) Ambiente virtualizado com capacidade de processamento matemático com alta 
velocidade (GPU), memória RAM de grandes volumes, discos SSD para conter dados de 
treinamento de modelos de Machine Learning. 
Assinale a alternativa com a ordem correta: 
Ocultar opções de resposta 
Correta: 
2, 3, 1. Resposta correta 
2, 1, 3. 
3, 1, 2. 
3, 2, 1. 
1, 3, 2. 
10. Pergunta 10 
0,5/0,5 
A combinação do Spark com o Hadoop se torna altamente flexível e responsiva para 
diferentes tipos de aplicações da data Science, sendo usada por empresas como Netflix, 
Twitter e Apple. 
Assim, considerando as informações apresentadas e os conteúdos estudados, analise 
as técnicas disponíveis a seguir e associe-as com suas respectivas características: 
1) Spark. 
2) Hadoop. 
( ) Utilização da memória compartilhada entre os cluster de forma mais eficaz. 
( ) Executa os jobs que precisam de dados em quantidades maiores que a memória 
compartilhada do cluster. 
( ) Executa os jobs usando mecanismo DAG (Direct Acyclic Graph), que pode executar 
tarefas mais complexas e mais rápidas. 
( ) Responsável pelo sistema de arquivos em cluster, da alta capacidade, com 
replicação e velocidade. 
( ) Executa o processamento de streaming e pipeline de dados usados por processos de 
ETL. 
Agora, assinale a alternativa que apresenta a sequência correta: 
Ocultar opções de resposta 
1, 1, 1, 2, 1. 
2, 1, 2, 1, 2. 
1, 2, 2, 2, 1. 
1, 2, 1, 1, 1. 
1, 2, 1, 2, 1. Correta

Outros materiais