Baixe o app para aproveitar ainda mais
Prévia do material em texto
Avaliação AV avalie seus conhecimentos Parte superior do formulário RETORNAR À AVALIAÇÃO Disciplina: EEX0174 - TÓPICOS DE BIG DATA EM PYTHON Período: Aluno: Matrícula: Data: Turma: 1a Questão (Ref.: 202008138455) Em relação aos formatos que os dados de Big Data, selecione a opção que corresponde a quantidade de formas que podem ser encontrados. 4 2 6 5 3 2a Questão (Ref.: 202008138272) Selecione a opção correta sobre o uso de Big Data. O volume e diversidade dos dados podem dar uma visão realística do que está sendo observado. Com projetos de Big Data é sempre possível detectar fraudes em operações financeiras. Grandes volumes de dados são úteis para testar a capacidade dos servidores de gerenciamento de dados. É impossível não utilizar aplicações de Big Data para gerenciar projetos de internet das coisas. Projetos de big de Big Data são uma forma de organizar tabelas normalizadas com grande volume de dados. 3a Questão (Ref.: 202008147209) Em relação à fase de mapeamento do Hadoop, selecione a opção correta que apresenta o responsável pela geração de fragmento para os componentes da fase de redução. Combinador. Particionador. Leitor de registros. Redutor. Mapeador. 4a Questão (Ref.: 202008146930) Ser capaz de gerenciar uma infraestrutura complexa é uma habilidade fundamental para o profissional de Tecnologia da Informação. Sendo assim, analise as alternativas e selecione a opção que apresenta o componente responsável por desempenhar o papel de mestre na arquitetura do Hadoop. Bloco de dados Replicador DataNode HServerMap NameNode 5a Questão (Ref.: 202008146980) O Spark é um framework de alto desempenho usado para aplicações de Big Data. Em relação à arquitetura do Spark, selecione a opção correta. O gerenciador de cluster do Spark faz o gerenciamento da execução das tarefas. Os Worker Nodes da arquitetura Spark são responsáveis pelo gerenciamento das máquinas que executarão como escravos. O gerenciador de cluster do Spark oferece suporte a Hadoop YARN. O Executor corresponde ao conjunto de máquina que executam como escravos. O Executor e os Worker Nodes desempenham papeis equivalentes na arquitetura do Spark. 6a Questão (Ref.: 202008147078) A biblioteca Pandas é amplamente utilizada para manipular dados heterogêneos, situação recorrente para aplicações de Big Data. Nesse sentido, selecione a opção que contém a estrutura de dados que possibilita o Cientista de dados atribuir nome para as colunas. PySpark SQL DataFrame RDD numpy.array 7a Questão (Ref.: 202008147982) A coleta e preparação dos dados para análise no Python são de extrema importância. Os dados secundários são assim definidos devido: O fato de terem sido obtidos a partir de terceiros. O fato de ocuparem menos espaço de memória. A sua baixa qualidade. O fato de requererem muito mais pré-processamento. O fato de virem de uma fonte alternativa não convencional. 8a Questão (Ref.: 202008147697) O seguinte constructo da linguagem Python representa o condicional simples: while if else for with 9a Questão (Ref.: 202008146903) As redes neurais são implementadas em Python através de uma biblioteca de processamento de cálculos em paralelo baseada em grafos. Qual o nome desta biblioteca? Pandas Plotly Tensorflow Scipy Numpy 10a Questão (Ref.: 202008147182) Qual o tipo de método nos permite visualizar a árvore de decisão na biblioteca Scikit-Learn? printf print cout plot_tree console.log Parte inferior do formulário
Compartilhar