Prévia do material em texto
02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS 1. Ref.: 6076913 Pontos: 1,00 / 1,00 A coleta e preparação dos dados para análise no Python são de extrema importância. Os dados secundários são assim definidos devido: O fato de requererem muito mais pré-processamento. O fato de virem de uma fonte alternativa não convencional. O fato de ocuparem menos espaço de memória. A sua baixa qualidade. O fato de terem sido obtidos a partir de terceiros. 2. Ref.: 6076628 Pontos: 1,00 / 1,00 O seguinte constructo da linguagem Python representa o condicional simples: if else with while for 02318 - BIG DATA ANALYTICS 3. Ref.: 6075829 Pontos: 1,00 / 1,00 Alfredo começou em um laboratório de pesquisa e inovação no começo deste ano. Este laboratório investiga a relação entre trocas de mensagens em redes sociais e variações na bolsa de valores, dependendo principalmente de modelos de redes neurais recorrentes. Com qual tipo de IA Alfredo está lidando? IA SubSimbólica IA Biológica IA Simbólica IA Quântica IA Pura 4. Ref.: 6075831 Pontos: 1,00 / 1,00 Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial? SIGKDD. KDM. SIGM. KDD-DM. CRISP-DM. 02508 - HADOOP E ARMAZENAMENTO DE DADOS 5. Ref.: 6076197 Pontos: 1,00 / 1,00 A respeito dos componentes do ecossistema do Hadoop, selecione a opção correta que apresenta o componente responsável pelo gerenciamento dos clusters. Flume HBase HCluster Zookeeper Spark 6. Ref.: 6076199 Pontos: 1,00 / 1,00 O sistema de arquivos distribuídos do Hadoop, conhecido como HDFS, foi idealizado para trabalhar com grandes volumes de dados. Selecione a opção correta que apresenta o paradigma como o HDFS funciona. Mestre e escravo. Distribuído e centralizado. Distribuído e distribuído. Centralizado e distribuído. Centralizado e centralizado. 02727 - PRINCÍPIOS DE BIG DATA 7. Ref.: 6067461 Pontos: 1,00 / 1,00 Selecione a opção correta a respeito do processamento e streaming de dados. Caracterizam-se pelo envio do mesmo dado por várias fontes Os dados sempre estão no mesmo formato Os dados podem vir de várias fontes Os dados são caracterizados também são denominados de lotes estáticos. Os dados sempre são provenientes de aplicações transacionais 8. Ref.: 6067205 Pontos: 1,00 / 1,00 Em relação aos modelos de serviço de nuvem, selecione a opção correta com o modelo de serviço focado no hardware. HaaS MaaS CaaS PaaS IaaS 02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON 9. Ref.: 6075911 Pontos: 1,00 / 1,00 O Spark é um framework de alto desempenho usado para aplicações de Big Data. Em relação à arquitetura do Spark, selecione a opção correta. Os Worker Nodes da arquitetura Spark são responsáveis pelo gerenciamento das máquinas que executarão como escravos. O Executor e os Worker Nodes desempenham papeis equivalentes na arquitetura do Spark. O Executor corresponde ao conjunto de máquina que executam como escravos. O gerenciador de cluster do Spark faz o gerenciamento da execução das tarefas. O gerenciador de cluster do Spark oferece suporte a Hadoop YARN. 10. Ref.: 6076011 Pontos: 1,00 / 1,00 A escolha adequada de uma linguagem de programação é fundamental para a maximização dos resultados almejados. Nesse sentido, selecione a opção que contém a linguagem de programação mais adequada para desenvolver aplicações para o Spark. R Python Java Script Java Scala