Baixe o app para aproveitar ainda mais
Prévia do material em texto
02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS 1. Ref.: 6076630 Pontos: 0,00 / 1,00 No contexto de Coleta de Dados, o que podemos afirmar sobre Dados Primários: I - São dados obtidos em primeira mão pelo cientista de dados ou pelo analista de dados II - São dados que precisam ser pré-processados para análise, e serão feitos exclusivamente no primeiro momento pelo dono dos dados, o analista em questão III - São obtidos através de softwares de monitoramento de logs, surveys, e bancos de dados Analise as frases listadas e assinale a alternativa correta. As opções I, II, e III estão corretas. Apenas as opções II e III. Apenas a opção II. Apenas as opções I e III. Apenas a opção I. 2. Ref.: 6076628 Pontos: 0,00 / 1,00 O seguinte constructo da linguagem Python representa o condicional simples: while with else if for 02318 - BIG DATA ANALYTICS 3. Ref.: 6076113 Pontos: 1,00 / 1,00 Qual o tipo de método nos permite visualizar a árvore de decisão na biblioteca Scikit-Learn? cout plot_tree printf print console.log 4. Ref.: 6075830 Pontos: 0,00 / 1,00 O boom da IA se deve ao surgimento de novas tecnologias e dispositivos que por estarem sempre conectados produzem uma quantidade enorme de dados. Estes dados que alimentam os modelos de aprendizado de máquina também são conhecidos como: Informações. Dados Faltantes. Big Data. Conhecimento. Observações. 02508 - HADOOP E ARMAZENAMENTO DE DADOS 5. Ref.: 6076197 Pontos: 0,00 / 1,00 A respeito dos componentes do ecossistema do Hadoop, selecione a opção correta que apresenta o componente responsável pelo gerenciamento dos clusters. Zookeeper HBase Spark Flume HCluster 6. Ref.: 6075861 Pontos: 0,00 / 1,00 Ser capaz de gerenciar uma infraestrutura complexa é uma habilidade fundamental para o profissional de Tecnologia da Informação. Sendo assim, analise as alternativas e selecione a opção que apresenta o componente responsável por desempenhar o papel de mestre na arquitetura do Hadoop. DataNode Bloco de dados HServerMap Replicador NameNode 02727 - PRINCÍPIOS DE BIG DATA 7. Ref.: 6067386 Pontos: 1,00 / 1,00 Em relação aos formatos que os dados de Big Data, selecione a opção que corresponde a quantidade de formas que podem ser encontrados. 5 2 3 6 4 8. Ref.: 6067203 Pontos: 0,00 / 1,00 Selecione a opção correta sobre o uso de Big Data. Com projetos de Big Data é sempre possível detectar fraudes em operações financeiras. Projetos de big de Big Data são uma forma de organizar tabelas normalizadas com grande volume de dados. O volume e diversidade dos dados podem dar uma visão realística do que está sendo observado. É impossível não utilizar aplicações de Big Data para gerenciar projetos de internet das coisas. Grandes volumes de dados são úteis para testar a capacidade dos servidores de gerenciamento de dados. 02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON 9. Ref.: 6075911 Pontos: 0,00 / 1,00 O Spark é um framework de alto desempenho usado para aplicações de Big Data. Em relação à arquitetura do Spark, selecione a opção correta. O gerenciador de cluster do Spark oferece suporte a Hadoop YARN. O Executor e os Worker Nodes desempenham papeis equivalentes na arquitetura do Spark. O gerenciador de cluster do Spark faz o gerenciamento da execução das tarefas. Os Worker Nodes da arquitetura Spark são responsáveis pelo gerenciamento das máquinas que executarão como escravos. O Executor corresponde ao conjunto de máquina que executam como escravos. 10. Ref.: 6076009 Pontos: 0,00 / 1,00 A biblioteca Pandas é amplamente utilizada para manipular dados heterogêneos, situação recorrente para aplicações de Big Data. Nesse sentido, selecione a opção que contém a estrutura de dados que possibilita o Cientista de dados atribuir nome para as colunas. RDD numpy.array DataFrame PySpark SQL
Compartilhar