Text Material Preview
Curso: Engenharia de Dados Disciplina: Interações entre big data e cloud computing 1) Sobre as linguagens de programação, considere as seguintes afirmações e marque V para verdadeiro e F para falso: ( ) I. A linguagem C tornou-se popular por volta de 1970, devido à sua robustez e confiabilidade, ganhou uma série de variedades, C++, C# entre outras. ( ) II. TypeScript é uma linguagem de código aberto criada pela Microsoft. Sua principal característica está no conjunto rigoroso de sintaxe do JavaScript, portanto, é muito semelhante a ela, o que a torna conhecida e de fácil uso. ( ) III. O SQL é uma linguagem de programação de alto nível criada para simplificar e aumentar a produtividade do ambiente de desenvolvimento, a fim de torná-lo leve, é dinâmica com o código aberto, presente em muitos aplicativos e o desenvolvedor consegue criar um aplicativo com pouca linha de código. ( ) IV. O Java é uma linguagem de alto nível orientada a objeto, revolucionou o uso da internet, de propriedade da Oracle, criada por cientistas da Sun Microsystems. Assinale a alternativa que contenha a sequência correta: Alternativas: · F – F – V – V. · V – V – V – F. · V – F – V – V. · V – V – F – F. · V – V – F – V. CORRETO Resolução comentada: a afirmação III está incorreta, pois o conceito apresentado não se refere ao SQL, mas à linguagem de programação RUBI. Essa linguagem é de alto nível, foi criada para simplificar e aumentar a produtividade do ambiente de desenvolvimento, a fim de torná-lo leve, é dinâmica e seu código é aberto. Está presente em muitos dos aplicativos, sendo a base do framework Ruby on Rails. Como é simples e sem regras rígidas, o desenvolvedor consegue criar um aplicativo com pouca linha de código, mas tem como ponto negativo a falta de flexibilidade Código da questão: 43908 2) Grande parte dos dados coletados pela organização são___________, ou seja, está em formato de texto em e-mail, blog, páginas na web, documentos corporativos, mensagens trocadas na mídia social, etc. Mas, sem dúvida, é a área mais quente da web (internet), pois tudo pode ser registrado e___________. Um elemento a se destacar é a classificação desses dados, que são conhecidos como ___________. Alternativas: · Textuais – analisado – não estruturados. CORRETO · Estruturados – textual – Big Data. · Textuais – analisado – estruturados. · Analisadas – estruturado – textual. · Não estruturados – textual – Big Data. Resolução comentada: grande parte dos dados coletados pela organização são textuais, ou seja, está em formato de texto de e-mail, blog, páginas na web, documentos corporativos, mensagens trocadas na mídia social, etc. Mas, sem dúvida, a área mais quente é a da web (internet), tudo pode ser registrado e analisado. Um elemento a se destacar está na classificação desses dados, que são conhecidos como não estruturados. Código da questão: 43891 3) Sobre a arquitetura Hadoop criada pela Apache Software Foundation, seria CORRETO afirmar que o Hadoop: Alternativas: · É um sistema de código fechado programado em Java. · Foi baseado no sistema de arquivo local GFS (Google File System) e no processamento centralizado do MapReduce. · É constituído por um sistema de arquivos locais centralizado em servidores locais. · É projetado para as mais diversas operações com dados em grande escala. CORRETO · Tem arquitetura distribuída e de baixa escalabilidade. Resolução comentada: a afirmação “É projetado para as mais diversas operações com dados em grande escala” está correta. As demais afirmações podem ser reescritas corretamente, como segue: - Hadoop é um sistema de código aberto programado em Java. - É constituído por sistemas de arquivo descentralizado e cluster distribuído. - Foi baseado no sistema de arquivo distribuído GFS (Google File System) e no processamento distribuído do MapReduce. - Tem arquitetura distribuída de alta escalabilidade. Código da questão: 43880 4) No artigo, Big Data in Practice, Bernard Marr (2019) afirma que Big Data é algo muito profundo e cita algumas áreas em que é possível ter excelente vantagens com seu uso. De acordo com as oportunidades da aplicação do Big Data, assinale a alternativa INCORRETA. Alternativas: · Melhora da segurança e aplicação da lei tem como exemplo a detecção de intenções terroristas, investigação de suspeitos e prevenção de ataques cibernéticos. · Dispositivos vestíveis, tais como os relógios e braceletes, são exemplos de qualificação pessoal e otimização de desempenho em Big Data. · Otimização de máquinas e desempenho de dispositivos tem como exemplo inteligência e autonomia das máquinas, por exemplo, o carro autônomo. · Predição de dados em rede social e pesquisa e previsão de tempo são exemplos de uso de Big Data para otimizar processos de negócios. · Decodificação de DNA possibilita encontrar nova cura e prever padrão de doenças, no entanto, por ser complexa, não se aplica ao Big Data. CORRETO Resolução comentada: a alternativa “Decodificação de DNA possibilita encontrar nova cura e prever padrão de doenças, no entanto, por ser complexa, não se aplica ao Big Data” está incorreta, pois melhorar a saúde e a saúde pública está relacionado com a análise de dados, habilitação da decodificação de DNA que possibilita encontrar nova cura, melhoria de tratamento e prevenção de padrão de doenças. Melhora no desempenho esportivo se relaciona com a adoção do Big Data para analisar vídeos, equipamentos esportivos, rastreio de atletas para acompanhar o sono e alimentação, bem como o estado emocional nas redes sociais. Código da questão: 43875 5) Pensando na estrutura do Big Data, assinale a alternativa correta: I. A estrutura do Big Data considera a origem e o formato dos dados e as fontes que provem dados são as mais diversas possíveis. II. São fontes geradoras de dado para Big Data os dispositivos diversos, dados estruturados de banco de dados organizacionais e/ou não estruturados que circulam pelas redes sociais e muitos outros lugares. III. O Big Data era referenciado inicialmente por 8 Vs, mas esse conceito tem se modificado, alguns os definem atualmente com 3 Vs: volume, velocidade e variedade. IV. Big Data leva a imaginar um monte de dados não sistematizado que passa por vários processamentos até fornecer algum tipo de informação. Alternativas: · I, III e IV. · I, II e IV. CORRETO · I, II e III. · I, II, III e IV. · II, III e IV. Resolução comentada: a afirmação III está incorreta, pois, inicialmente, o Big Data era referenciado por 3 Vs (volume, velocidade e variedade). Esse conceito tem se modificado, alguns definem até 8 ou mais Vs, mas os 5 Vs são mais utilizados. Para Bernard, os 5 Vs são: volume, velocidade, variedade, veracidade e valor (MARR, 2014). Código da questão: 43877 6) Sobre a análise dos dados e a inteligência dos algoritmos, considere as seguintes afirmações e marque V para verdadeiro e F para falso: ( ) Os celulares dispõem de aplicativos avançados e inovadores capazes de coletar conteúdo personalizado, que retrata um contexto real. ( ) A análise de dados na web tem um componente constituído pelas plataformas e serviços de computação em nuvem (icloud), neles estão incluídos software de sistema, hardware da web, aplicativos e serviços. ( ) A análise de sentimentos é um tipo de análise textual; ela identifica a opinião por meio da identificação de afetos, raiva, carinho e outros estados emocionais. ( ) O aprendizado de máquina envolve somente a lógica do algoritmo, geralmente baseado em modelos matemáticos utilizados em aplicativos de dados, texto, rede social e web. Assinale a alternativa que contenha a sequência correta: Alternativas: · V – F – F – V. · F – F – V – V. · V – V – V – F. CORRETO · V – V – F – V. · V – V – F – F. Resolução comentada: a quarta afirmação, “O aprendizado de máquina envolve somente a lógica do algoritmo, geralmente baseado em modelos matemáticos utilizados em aplicativos de dados, texto, rede social e web”, é falsa, pois o aprendizado de máquina também envolve a estatística e modelos matemáticos. Código da questão:43893 7) Com o crescimento rápido de novas tecnologias e o já estabelecido serviço de computação em nuvem e Big Data, é primordial que as organizações implementem e amadureçam continuamente o seu uso, no entanto, o Big Data tem vários desafios pela frente. Considere as afirmações abaixo e assinale a verdadeira. I. Um desafio está no crescimento da demanda de armazenamento e processamento relacionada com a capacidade do provedor e da indústria da tecnologia da informação conseguir atender à demanda no futuro. II. A integridade dos dados se refere a perda, modificação, acesso e exatidão. A estrutura da nuvem deve garantir a segurança dos dados, gerenciar os usuários, fornecer proteção física e controlar o acesso. III. O Big Data colhe dados de várias fontes, o problema é que muitas não são conhecidas nem confiáveis e não há maneiras de verificação na maioria delas. IV. Apesar de ser uma das características do Big Data, a variedade dos dados somada às diferentes fontes é problema. Com a expansão, a dificuldade de armazenar e tratar dados não estruturados e semiestruturados aumenta. Alternativas: · I, II, III e IV. CORRETO · I, II e III. · II, III e IV. · I, III e IV. · I, II e IV. Resolução comentada: todas as afirmações estão corretas e se relacionam com os desafios do Big Data. Código da questão: 43902 8) I. A lógica do MapReduce conduz grande quantidade de dados ao processamento distribuído e paralelo. OS SERVIDORES processam petabytes de dados, tanto estruturados como não estruturados, armazenados no HDFS. PORTANTO II. O processo distribuído e paralelo do MapReduce é feito com base na divisão e distribuição dos dados juntamente com um processamento paralelo distribuído e, finalmente, a redução dos dados e armazenamento. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: · As duas afirmações são falsas. · A primeira afirmação é falsa e a segunda é verdadeira. · A primeira afirmação é verdadeira e a segunda é falsa. · As duas afirmações são verdadeiras e a segunda não justifica a primeira. · As duas afirmações são verdadeiras e a segunda complementa a primeira. CORRETO Resolução comentada: as duas afirmações são verdadeiras e a segunda explica o motivo do processamento paralelo e distribuído do Hadoop. Código da questão: 43884 9) Para cumprir seus objetivos, ________________ precisa manter em operação uma série de __________ poderosos, servidores, banco de dados, ferramentas que coletam, classificam e processam grande volume e variedade de dados em formatos diferentes com alta velocidade. O Big Data é categorizado por classes que reúnem vários componentes. A compreensão de sua estrutura facilita o entendimento da relação da ___________________ com o Big Data. Alternativas: · O IaaS – recursos – computação em nuvem. · O SaaS – recursos – computação em nuvem. · A computação em nuvem – recursos – Big Data. · O Big Data – recursos – computação em nuvem. CORRETO · O Big Data – algoritmos – computação em nuvem. Resolução comentada: as palavras que completam a lacuna são “o Big Data – recursos – computação em nuvem”, pois o Big Data, para cumprir seus objetivos, requer uma gama de recursos poderosos, servidores, banco de dados, ferramentas que coletam, classificam e processam grande volume e variedade de dados em formatos diferentes com alta velocidade. O Big Data é categorizado por classes que reúnem seus componentes. A compreensão dessa estrutura facilita o entendimento da relação da computação em nuvem com o Big Data. Código da questão: 43901 10) O aprendizado de máquina possui abordagens diferentes com o intuito de melhorar o desempenho dos modelos preditivos. Elas variam de acordo com o problema de negócios. Considere as afirmações abaixo: I. Aprendizado supervisionado tem o objetivo de encontrar padrões em um grupo de dados cuja classificação é razoavelmente conhecida e, então, aplicar o resultado em um processo analítico. II. Aprendizado NÃO supervisionado é indicado quando o problema analisado possui enorme variedade e quantidade de dados não estruturados ou sem rótulo. III. Aprendizado por reforço usa técnica de aprendizado comportamental, por meio de feedback da análise dos dados, e direciona o usuário para o melhor desempenho. O algoritmo não é treinado com uma coleção de dados, o aprendizado se dá por tentativa e erro. IV. Rede neural tenta simular o funcionamento do cérebro humano com base no treinamento para solução de problemas simples e bem definido. A abordagem de rede neural, por ser uma técnica simples, não é recomendada para reconhecimento de voz, imagem e comportamento. São verdadeiras as afirmações: Alternativas: · II, III e IV. · I, III e IV. · I, II e IV. · I, II, III e IV. · I, II e III. CORRETO Resolução comentada: as afirmações I, II e III são verdadeiras. A afirmação IV está incorreta, pois a rede neural é indicada principalmente para problemas complexos e pouco definidos por ser uma técnica complexa recomendada para reconhecimento de voz, imagem, sentimento, comportamento, IoT, rastreamento, etc. Código da questão: 43897