Prévia do material em texto
02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS 1. Ref.: 6076846 Pontos: 0,00 / 1,00 Os dados que, por alguma razão, normalmente interferência humana, não chegam com todos os atributos esperados durante a coleta de dados, são conhecidos como: Embaralhados. Enviesados. Faltantes. Nulos. Corrompidos. 2. Ref.: 6076628 Pontos: 1,00 / 1,00 O seguinte constructo da linguagem Python representa o condicional simples: if while with for else 02318 - BIG DATA ANALYTICS 3. Ref.: 6075827 Pontos: 1,00 / 1,00 Quais os métodos de aprendizado de máquina que existem? Aprendizado Supervisionado, Não-Supervisionado, Por Reforço, e Semisupervisionado Aprendizado Supervisionado, Não-Supervisionado, Por Força Bruta, e Semisupervisionado Aprendizado Supervisionado, Escondido, Por Reforço, e Semisupervisionado Aprendizado Supervisionado, Não-Supervisionado, Por Reforço, e Aleatório Aprendizado Supersticioso, Não-Supervisionado, Por Reforço, e Semisupervisionado 4. Ref.: 6075831 Pontos: 1,00 / 1,00 Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial? KDD-DM. CRISP-DM. KDM. SIGM. SIGKDD. 02508 - HADOOP E ARMAZENAMENTO DE DADOS 5. Ref.: 6075861 Pontos: 1,00 / 1,00 Ser capaz de gerenciar uma infraestrutura complexa é uma habilidade fundamental para o profissional de Tecnologia da Informação. Sendo assim, analise as alternativas e selecione a opção que apresenta o componente responsável por desempenhar o papel de mestre na arquitetura do Hadoop. NameNode DataNode HServerMap Bloco de dados Replicador 6. Ref.: 6076199 Pontos: 1,00 / 1,00 O sistema de arquivos distribuídos do Hadoop, conhecido como HDFS, foi idealizado para trabalhar com grandes volumes de dados. Selecione a opção correta que apresenta o paradigma como o HDFS funciona. Mestre e escravo. Centralizado e centralizado. Distribuído e distribuído. Distribuído e centralizado. Centralizado e distribuído. 02727 - PRINCÍPIOS DE BIG DATA 7. Ref.: 6067207 Pontos: 1,00 / 1,00 Em relação às características do processamento de fluxo de dados, selecione a opção correta. Representam o estado de um sistema em um dado momento O fluxo de dados é intermitente São invariáveis no tempo Sempre são do mesmo tipo São relacionados à aplicações de internet das coisas 8. Ref.: 6067203 Pontos: 1,00 / 1,00 Selecione a opção correta sobre o uso de Big Data. Projetos de big de Big Data são uma forma de organizar tabelas normalizadas com grande volume de dados. Grandes volumes de dados são úteis para testar a capacidade dos servidores de gerenciamento de dados. O volume e diversidade dos dados podem dar uma visão realística do que está sendo observado. É impossível não utilizar aplicações de Big Data para gerenciar projetos de internet das coisas. Com projetos de Big Data é sempre possível detectar fraudes em operações financeiras. 02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON 9. Ref.: 6076011 Pontos: 1,00 / 1,00 A escolha adequada de uma linguagem de programação é fundamental para a maximização dos resultados almejados. Nesse sentido, selecione a opção que contém a linguagem de programação mais adequada para desenvolver aplicações para o Spark. Scala Python Java Script Java R 10. Ref.: 6076003 Pontos: 1,00 / 1,00 Compreender os conceitos e princípios do framework Apache Spark é fundamental para o cientista de dados. Selecione a opção correta que contém o componente do ecossistema Spark responsável por dar suporte para tratar fluxo de dados típicos de aplicações de tempo real. Spark Hadoop Spark Core Spark SQL Spark Streaming RDDs