Prévia do material em texto
· Pergunta 1 0,25 em 0,25 pontos Durante os últimos 50 anos o crescimento dos sistemas de informação, no que se refere a sua capacidade para capturar, tratar, armazenar, compartilhar, transferir, analisar e visualizar dados aumentou de forma exponencial. Além disso, pessoas e organizações dependem cada vez mais de dispositivos informatizados e das fontes de informação provenientes da Internet. A maioria dos dados armazenados não são estruturados e as organizações frequentemente têm enfrentado desafios para capturá-los, selecioná-los e analisá-los. Uma das tarefas mais desafiadoras para as organizações atualmente é extrair. Esses dados, que são altamente complexos e muito volumosos se tornaram uma área da computação responsável por esse tratamento massivo de dados. Qual é o nome dado para essa área? Resposta Selecionada: c. Big Data. Respostas: a. Machine Learning. b. Internet of Things. c. Big Data. d. Artificial Inteligence. e. Industrial Automation. Comentário da resposta: Resposta: C Comentário: A maioria dos dados armazenados não são estruturados, e as organizações frequentemente vêm enfrentando desafios para capturá-lo, selecioná-lo e analisá-lo. Uma das tarefas mais desafiadoras para as organizações de hoje é extrair informações e o valor que é gerado por esses dados armazenados em seus sistemas de informação. Esses dados, que são altamente complexos e muito volumosos para serem tratados por um DBMS tradicional, são chamados de Big data. · Pergunta 2 0,25 em 0,25 pontos A Big data é um termo definido para um conjunto de dados que, de tão grande e sofisticado, se torna problemático processá-los utilizando ferramentas de gerenciamento de banco de dados disponíveis ou aplicativos de processamento contemporâneos tradicionais. Recentemente, algumas tendências são aplicadas no emprego de análises do comportamento do usuário, análises preditivas ou alguns métodos de análise de dados que extraem valor desses novos dados analíticos do ecossistema. A Big data apresenta algumas características (V’s), entre elas uma que trata da validade e exatidão dos dados. Qual é o nome dado para essa característica do Big data? Resposta Selecionada: b. Veracidade. Respostas: a. Variedade. b. Veracidade. c. Velocidade. d. Valor. e. Viabilidade. Comentário da resposta: Resposta: B Comentário: Veracidade: trata-se de validade e exatidão dos dados. Quão preciso e utilizáveis são os dados. · Pergunta 3 0,25 em 0,25 pontos Aplicações tradicionais de computadores utilizam dados estruturados, organizados em linhas e colunas, em formato de tabela, e são encontrados em banco de dados relacionais, sendo muito eficientes quanto à recuperação e processamento. Também utilizam dados não estruturados que são dados de vídeo, áudio, e-mails, documentos de textos em geral ou gerados por aplicativos de redes sociais como mensagens do WhatsApp, por exemplo. Alguns tipos de dados possuem uma organização diferenciada, normalmente proveniente da Web nos formatos XML e JSON, que precisam de uma prévia análise dos dados para identificação de sua estrutura. Esses dados são: Resposta Selecionada: e. Semiestruturados. Respostas: a. Predefinidos. b. Pré-estruturados. c. Preestabelecidos. d. Intraestruturados. e. Semiestruturados. Comentário da resposta: Resposta: E Comentário: Semiestruturados: são dados com organização diferenciada, normalmente provenientes da Web nos formatos XML e JSON, que precisam de uma prévia análise dos dados para identificação de sua estrutura. · Pergunta 4 0,25 em 0,25 pontos O RDBMS (Sistema de gerenciamento de banco de dados relacional) vem sobrevivendo como uma ferramenta para armazenamento e processamento de dados. A escala de RDBMS tradicional, quando comparado no seu poder de computação esperado para processar uma grande quantidade de dados com baixa latência teve um preço muito alto. Isso levou ao surgimento de novas tecnologias de baixo custo, baixa latência e altamente escalonáveis e de código aberto. Hoje, lidamos com clusters Hadoop com milhares de nós tratando milhares de terabytes de dados. Entre as principais características que tornaram o Hadoop interessante para aplicações que envolvem um grande volume de dados podemos citar: Resposta Selecionada: c. Escalabilidade. Respostas: a. Interdependência. b. Dependência. c. Escalabilidade. d. Complexidade. e. Autoprogramação. Comentário da resposta: Resposta: C Comentário: Entre as principais características que tornaram o Hadoop tão interessante para aplicações que envolvem o grande volume de dados estão: -Baixo custo: Muitas soluções necessitam de hardware de alto desempenho para o processamento dos dados, o Hadoop foi projetado para o armazenamento e processamento de dados em servidores tradicionais, reduzindo consideravelmente custos com infraestrutura. -Escalabilidade: O Hadoop oferece escalabilidade linear para as aplicações, além de permitir a execução de aplicações em ambientes de cluster com centenas, ou até mesmo milhares de servidores, sem ser necessário a refatoração de código. -Tolerância às falhas: sabe-se que, em ambientes com grandes conjuntos de servidores, é comum a ocorrência de falhas nos componentes de hardware. · Pergunta 5 0,25 em 0,25 pontos O NoSQL (abreviação de Not only SQL, ou “não somente SQL”) foi um termo cunhado para definir os novos modelos de armazenamento de dados. Ele foi criado para atender necessidades de flexibilidade, disponibilidade, escalabilidade e desempenho das aplicações inseridas no contexto da Big Data. Uma das suas principais diferenças, se comparada ao banco de dados relacional, destaca-se o foco principal voltado a integridade dos dados. Os modelos existentes de NoSQL podem ser qualificados em 4 tipos. O NoSQL apresenta quatro categorias, onde a mais popular, oferece simplicidade e flexibilidade no gerenciamento dos dados além de meios de criação de índices sobre os valores dos dados armazenados, enriquecendo as possibilidades de consultas. Qual é o nome dado a essa caracterísitca NoSQL? Resposta Selecionada: d. Modelo orientado a documentos. Respostas: a. Modelo orientado a chave-valor. b. Modelo orientado a grafos. c. Modelo orientado a colunas. d. Modelo orientado a documentos. e. Modelo orientado a linhas. Comentário da resposta: Resposta: D Comentário: Orientado a documentos: categoria NoSQL mais popular, oferece simplicidade e flexibilidade no gerenciamento dos dados, oferece ainda, meios de criação de índices sobre os valores dos dados armazenados, enriquecendo as possibilidades de consultas. · Pergunta 6 0,25 em 0,25 pontos O primeiro registro do termo Ciência de Dados remonta a 1960 por Peter Naur, que supostamente usou o termo Ciência de Dados como um substituto da ciência da computação e, eventualmente, introduziu o termo “Datalogia”. Em 1974, Naur lançou um livro intitulado: “Concise Survey of Computer Methods”, com uso liberal do termo Ciência de Dados em seu livro. A Ciência de Dados possui um ciclo de vida de projetos, que é uma metodologia amplamente usada para projetos que requerem a implantação de aplicativos baseados em inteligência artificial e/ou algoritmos de aprendizado de máquina. Esse ciclo de vida foi projetado como uma iteração ágil e sequencial de etapas que servem como orientação sobre as tarefas necessárias, para o uso de modelos preditivos. Qual é o nome dado para esse tipo de ciclo de vida? Resposta Selecionada: a. TDSP- Team Data Science Process. Respostas: a. TDSP- Team Data Science Process. b. MapReduce. c. NoSQL. d. MPP (abreviação de Massively Parallel Processing). e. Cascading. Comentário da resposta: Resposta: A Comentário: O O ciclo de vida para projetos de ciência de dados (TDSP- Team Data Science Process)é uma metodologia amplamente usada para projetos que requerem a implantação de aplicativos baseados em inteligência artificial e / ou algoritmos de aprendizado de máquina. · Pergunta 7 0,25 em 0,25 pontos O ciclo de vida do TDSP ( Team Data Science Process ou ciclo de vida para projetos de ciência de dados) serve como um modelo padronizado, bem definido, com conjuntos de artefatos, que podem ser usados para angariar colaboração da equipe de forma eficaz em toda linha de produção do software. Esse ciclo de vida é composto por uma seleção das melhores práticas e estruturas que facilitam o sucesso da entrega de soluções de análise preditiva e aplicativos inteligentes. Dentre os cinco estágios do TDSP, um é responsável por encontrar recursos de dados ideais para a modelo de aprendizagem de máquina, o qual possui informações suficiente para prever as variáveis alvo, com precisão e pode ser implantado no ambiente de produção. Esse estágio é: Resposta Selecionada: d. Estágio 3 – Modelagem. Respostas: a. Estágio 2 – Aquisição e compreensão de dados. b. Estágio 4 – Implantação. c. Estágio 5 – Aceitação do cliente. d. Estágio 3 – Modelagem. e. Estágio 1 – Compreensão do negócio. Comentário da resposta: Resposta: D Comentário: Estágio 3 – Modelagem. Nesta fase o objetivo é encontrar “recursos de dados ideais” para a modelo de aprendizagem de máquina, o qual possui informações suficientes para prever as variáveis alvo, com precisão e pode ser implantado no ambiente de produção. · Pergunta 8 0,25 em 0,25 pontos O ciclo de vida do TDSP ( Team Data Science Process ou ciclo de vida para projetos de ciência de dados) serve como um modelo padronizado, bem definido, com conjuntos de artefatos, que podem ser usados para angariar colaboração da equipe de forma eficaz em toda linha de produção do software. Esse ciclo de vida é composto por uma seleção das melhores práticas e estruturas que facilitam o sucesso da entrega de soluções de análise preditiva e aplicativos inteligentes. Dentre os cinco estágios do TDSP, um é responsável por reunir e detalhar as variáveis essenciais que serão usadas como alvos para o modelo e as métricas associadas onde essas variáveis acabarão por determinar o sucesso geral do projeto. Esse estágio é: Resposta Selecionada: e. Estágio 1 – Compreensão do negócio. Respostas: a. Estágio 2 – Aquisição e compreensão de dados. b. Estágio 4 – Implantação. c. Estágio 5 – Aceitação do cliente. d. Estágio 3 – Modelagem. e. Estágio 1 – Compreensão do negócio. Comentário da resposta: Resposta: E Comentário: O Estágio 1 - Compreensão do negócio: O objetivo desta etapa é reunir e detalhar as variáveis essenciais que, serão usadas como alvos para o modelo e as métricas associadas, essas variáveis acabarão por determinar o sucesso geral do projeto. Outro objetivo significativo desta etapa é a identificação das fontes de dados que a empresa já possui ou pode precisar adquirir. · Pergunta 9 0,25 em 0,25 pontos Ao utilizar a Ciência de Dados, as empresas não são apenas capazes de identificar os terminais de rede específicos que iniciaram o ataque cibernético, mas também estão em posição de prever possíveis ataques futuros contra seus sistemas. Ataques cibernéticos podem resultar na perda de dados e informações inestimáveis, resultando em danos extremos às organizações. De que forma a Ciência de Dados pode auxiliar para que isso ocorra? Resposta Selecionada: c. Através da detecção do conjunto de dados visados com mais frequência, prevendo futuros ataques cibernéticos em potencial. Respostas: a. Através de operações realizadas no processador, armazenamento em HD e movimentação de dados para RAM. b. Através da quantidade de máquinas interligadas que proporcionarão a intermitência e latência de resposta de um sistema de alto desempenho. c. Através da detecção do conjunto de dados visados com mais frequência, prevendo futuros ataques cibernéticos em potencial. d. Através da Redução da demanda por novos produtos e pelo uso de matérias-primas. e. Através da produção de circuitos impressos para atender a demanda dos clientes. Comentário da resposta: Resposta: C Comentário: A ciência de dados pode ajudar no desenvolvimento de tais protocolos e algoritmos impenetráveis. Ao analisar as tendências e padrões de ataques cibernéticos anteriores a empresas em diferentes setores industriais, a ciência de dados pode ajudar a detectar o conjunto de dados visados com mais frequência, e até mesmo prever futuros ataques cibernéticos em potencial. · Pergunta 10 0,25 em 0,25 pontos A Cibersegurança é uma prática criada para garantir a integridade, confidencialidade e disponibilidade de informações. Pode representar a capacidade de se defender e se recuperar de acidentes, como falhas no disco rígido ou falta de energia, e de ataques de adversários. Existem várias ameaças, em diferentes campos de negócios e vários métodos existentes são utilizados para superar as referidas ameaças. Tecnicamente, qual é o nome dado aos criminosos digitais? Resposta Selecionada: e. Cibercriminosos. Respostas: a. Gamers. b. Influencers. c. Youtubers. d. Intercriminosos. e. Cibercriminosos. Comentário da resposta: Resposta: E Comentário: Existem várias ameaças, em diferentes campos de negócios e os vários métodos existentes para superar as referidas ameaças tem sido discutido. Os cibercriminosos estão aumentando drasticamente em número em paralelo com o mundo cibernético. Para trabalhar contra os criminosos cibernéticos e proteger o interesse de civis comuns, Big Data Analytics assume a liderança. Big data é enorme em quantidade e qualidade e pode ser completamente usado para analisar vários padrões e anomalias de comportamento, que podem evitar ameaças ou qualquer ataque futuro.