Prévia do material em texto
Fazer teste: AS I PERGUNTA 1 Assinale a alternativa que não traz uma correta afirmação para o V de volume no contexto de Big Data. c. Os sistemas tradicionais têm dificuldades para armazenar, processar e compreender esses tipos de dados. (variedade de dados) PERGUNTA 2 Assinale alternativa que não traz uma definição para Big Data. e. São sistemas que armazenam os dados por meio do processo de modelagem de Entidade e Relacionamento (ER). PERGUNTA 3 Assinale a alternativa que traz uma definição para Big Data. d. refere-se a grandes conjuntos de dados que são difíceis de armazenar, pesquisar, visualizar e analisar. PERGUNTA 4 Assinale a alternativa que traz uma correta afirmação para o V de variedade no contexto de Big Data. c. Os sistemas tradicionais têm dificuldades para armazenar, processar e compreender esses tipos de dados. PERGUN TA 5 Analise as afirmativas e selecione a alternativa correta. I - É verdade que os sistemas tradicionais têm dificuldades para armazenar, processar e compreender esses tipos de dados. II - É verdade que a atual quantidade de dados disponíveis para as organizações está em ascensão, enquanto o percentual de dados que essas podem analisar está em declínio. III -É verdade que a afirmativa I está relacionada à variedade de dados, enquanto que a afirmativa II está relacionada ao volume. a. I - Verdadeiro, II – Verdadeiro, III – Verdadeiro. Fazer teste: AS II PERGUNTA 1 Assinale a alternativa que não traz um exemplo de dado não estruturado. e. videos PERGUNTA 2 Assinale alternativa traz a correta definição para o V de veracidade no contexto de Big Data. a. Está relacionado à confiabilidade dos dados. PERGUNTA 3 Assinale a alternativa que não condiz com a característica de veracidade dos dados no contexto de Big Data. d. os dados que são produzidos possuem uma vida útil muito curta , por isso as organizações devem ser capazes de analisa-los quase em tempo real, se eles esperam encontrar ideias e oportunidades nestes dados. PERGUNTA 4 Analise as afirmativas e selecione a alternativa correta: I - Os dados que são produzidos possuem uma vida útil maior e tem aumentado; II – A validação dos dados oriundos de diversos sistemas, mídias ou redes sociais, trazem uma complexidade grande para a escolha, transformação, processamento, análise e validação dos resultados e informações geradas. III – As empresas que investem em análise de dados como um ativo para a tomada de decisão são mais bem sucedidas. b. I – Falso, II- Verdadeiro, III – Verdadeiro; PERGUNTA 5 Analise as afirmativas e assinale a alternativa correta. I – Os dados de fluxo são uma categoria especial de Big data, ao invés de ser um formato é um tipo especial de processamento. II - Dados gerados por máquinas constituem uma grande variedade de dispositivos porém não podem ser encarados como uma fonte ou origem de dados para Big Data; III - aplicações de fluxo contínuo incluem detecção de fraude, segurança física, monitoramento de tráfego, monitoramento veicular ou monitoramento médico. d. I – Verdadeiro, II- Falso, III – Verdadeiro; PERGUN TA 6 Analise as afirmativas e selecione a alternativa correta. I - Soluções de Big Data são ideais para analisar apenas os dados estruturados. II - Soluções de Big Data são ideais para analisar não apenas os dados estruturados. III - Soluções de Big Data são ideais para analisar os dados estruturados, não estruturados e semiestruturados. b. I – Falso, II- Verdadeiro, III – Verdadeiro; Fazer teste: AS III PERGUNTA 1 Analise a afirmativa e assinale a alternativa que traz a dada característica presente na computação em nuvem: I – Os consumidores usam um portal de auto-serviço baseado na web para visualizar um catálogo de serviços e solicitar serviços em nuvem. Isso permite aos consumidores o provisionamento de serviços em nuvem de uma forma simples e flexível e reduz o tempo necessário implantação de novos ou recursos de TI adicionais. b. On-demand Self-service. PERGUNTA 2 Analise a afirmativa e assinale a alternativa que traz a dada característica presente na computação em nuvem: I – Permite aos provedores de modo a melhorar a utilização de recursos e à prestação de serviços de forma flexível, recuperar recursos de computação, que estão reunidos para servir a múltiplos clientes, usando um modelo multi-tenant, com diferentes recursos físicos e virtuais atribuídas e realocados dinamicamente de acordo com a demanda do cliente. Há um senso de independência local em que o cliente geralmente não tem controle ou conhecimento sobre a localização exata dos recursos disponibilizados, mas pode ser capaz de especificar o local em um nível mais alto de abstração (por exemplo, país, estado, ou datacenter). Exemplos de recursos incluem armazenamento, processamento, memória e largura de banda de rede. c. Pooling de Recursos. PERGUNTA 3 Assinale a alternativa que não traz um benefício apontado da computação em nuvem. c. Baixa disponibilidade. PERGUNTA 4 Assinale a alternativa que não traz uma característica da computação em nuvem. d. Serviço não mensurado. PERGUN TA 5 1. Analise a afirmativa e assinale a alternativa que traz a dada característica presente na computação em nuvem: I – os consumidores podem se adaptar a variações em cargas de trabalho e manter os níveis de desempenho requeridos. Os clientes podem ser capazes de evitar custos excessivos, ou excesso de provisionamento de recursos, pois esses recursos podem ser elasticamente provisionados e liberados, em alguns casos, automaticamente, para escalar rapidamente recursos mensuráveis de acordo com a demanda. Para o consumidor, os recursos disponíveis para realizar o provisionamento muitas vezes parecem ser ilimitados e pode selecionado ou provisionado em qualquer quantidade a qualquer momento. d. Elasticidade rápida. Fazer teste: AS IV PERGUNTA 1 Analise as afirmativas: I. Apache Pig é uma plataforma para análise de grandes conjuntos de dados que consiste em uma linguagem de alto nível para expressar programas de análise de dados; II. Uma estrutura para armazenamento de dados em cima do Hadoop, o Zoopkeeper cresceu a partir de uma necessidade de gerenciar e aprender com os grandes volumes de dados que o Facebook estava produzindo todos os dias a partir de sua crescente rede social.; III. HBase é um banco de dados distribuído construído sob o HDFS. É a aplicação Hadoop para usar quando você precisa em tempo real de leitura/gravação de acesso aleatório para grandes conjuntos de dados; c. I – correta, II – incorreta e III - correta. PERGUNTA 2 Analise a definição: é um sistema de arquivos projetado para armazenar arquivos extremamente grandes com um padrão de fluxo de acesso, executar sob clusters de computadores pessoais ou plataformas de hardware comuns (WHITE, 2015). Selecione a alternativa a qual a definição se refere. d. HDFS. PERGUNTA 3 Assinale a alternativa que traz a definição de coisas no contexto de internet das coisas. e. A aplicação do termo Coisas, inclui substâncias e produtos que são bases da sobrevivência humana e que existem em grandes quantidades e de diferentes tipos. PERGUNTA 4 Analise a definição: é o termo usado para se referir a uma família de projetos relacionados, que compõe a infraestrutura para computação distribuída e de larga escala de processamento, que usa o conceito de Big Data. Selecione a alternativa a qual a definição se refere. b. Hadoop. PERGUNTA 5 Analise as afirmativas: I - MapReduce é o termo usado para se referir a uma família de projetos relacionados, que compõe a infraestrutura para computação distribuída e de larga escala de processamento, que usa o conceito de Big Data; II - Modelo de MapReducedivide o processamento em mapas e o divide em fases, cada fase se baseia em um par de chave/valor usado como entrada e saída para o processo; III - A biblioteca de software Apache Hadoop é um framework que permite o processamento distribuído de grandes conjuntos de dados em clusters de computadores que utilizam modelos de programação simples; Selecione a correta alternativa quanto às afirmativas: a. I – correta, II – correta e III - correta. PERGUNTA 6 Analise as afirmativas com relação à IoT e assinale a alternativa correta: I - A IoT envolve uma grande quantidade de nós. II - A utilização de IoT produzirá um pequeno volume de dados. III - O As informações geradas pelos diferentes dispositivos deverão ser processadas ou guardadas para um posterior processamento. c. I – Verdadeiro, II – Falso, III - Verdadeiro. Fazer teste: AS V PERGUNTA 1 Analise as afirmativas: I. O Resilient Distributed Datasets (RDD) é o conceito central da plataforma Spark. Foi desenvolvido para suportar o armazenamento de dados na memória e distribuído ou em um cluster, que implementa sua tolerância a falhas, devido, em parte, ao seu rastreamento de dados brutos ou processamentos.; II. O RDD é uma funcionalidade permite que usuários da plataforma ou software R utilizem funções ou funcionalidades Spark de maneira mais usual.; III. Spark Streaming aproveita a capacidade de processamento rápido da Spark Core para executar os processamentos. Permite a execução e transformações RDD (Solids Distributed Datasets) nesses pedações menores de dados e lotes de processamento.; Selecione a correta alternativa quanto às afirmativas: c. I – correta, II – incorreta e III - correta. PERGUNTA 2 Analise as afirmativas: I. O Spark Core é a plataforma principal de execução que possibilita é base para todas as outras funcionalidades. Ela fornece a execução em memória e faz referência a conjuntos de dados em sistemas de armazenamento externos e distribuídos; II. O framework Spark necessita, para sua execução básica, da linguagem Java, a linguagem Scala e a linguagem Python instaladas no sistema operacional; III. MLlib é uma biblioteca de aprendizagem por máquina distribuída que roda sobre a arquitetura de Spark baseada em memória distribuída; Selecione a correta alternativa quanto às afirmativas: c. I – correta, II – incorreta e III - correta. PERGUNTA 3 Analise a definição: é um projeto de código livre da fundação Apache que possui uma biblioteca de implementação de algoritmos para aprendizagem de máquina. Selecione a alternativa que traz o nome da ferramenta ou projeto a qual a definição se refere: c. Mahout. PERGUNTA 4 Analise as afirmativas: I. O Mahout é uma ferramenta desenvolvida em linguagem de programação Java dentro do projeto de computação distribuída Hadoop; II. O projeto Mahout possui implementações de diversos algoritmos em sua execução direta no Hadoop com o Mapreduce; III. O projeto Mahout não permite integração e implementações de algoritmo usando o Spark; Selecione a correta alternativa quanto às afirmativas: d. I – correta, II – correta e III - incorreta. PERGUNTA 5 Analise o comando: hadoopfs - copyFromLocal C50 / Analise as afirmativas quanto ao comando: I. -copyFromLocal serve para copiar algo para o HDFS; II. C50 é a pasta ou arquivo de origem a ser copiado; III. / serve para formatar a pasta de destino; Selecione a correta alternativa quanto às afirmativas: d. I – correta, II – correta e III - incorreta.