Baixe o app para aproveitar ainda mais
Prévia do material em texto
Disciplina: TÓPICOS DE BIG DATA EM PYTHON AV Aluno: Professor: ROBSON LORBIESKI Turma: 01 EEX0174_AV_ (AG) 14/06/2022 16:00:17 (F) Avaliação: 3,0 Nota Partic.: Av. Parcial.: 2,0 Nota SIA: 3,0 pts Estação de trabalho liberada pelo CPF com o token 241401 em 14/06/2022 15:47:16. O aproveitamento da Avaliação Parcial será considerado apenas para as provas com nota maior ou igual a 4,0. 02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS 1. Ref.: 6076913 Pontos: 0,00 / 1,00 A coleta e preparação dos dados para análise no Python são de extrema importância. Os dados secundários são assim definidos devido: O fato de virem de uma fonte alternativa não convencional. A sua baixa qualidade. O fato de ocuparem menos espaço de memória. O fato de terem sido obtidos a partir de terceiros. O fato de requererem muito mais pré-processamento. 2. Ref.: 6076846 Pontos: 0,00 / 1,00 Os dados que, por alguma razão, normalmente interferência humana, não chegam com todos os atributos esperados durante a coleta de dados, são conhecidos como: Embaralhados. Corrompidos. Faltantes. Enviesados. Nulos. 02318 - BIG DATA ANALYTICS 3. Ref.: 6076113 Pontos: 0,00 / 1,00 Qual o tipo de método nos permite visualizar a árvore de decisão na biblioteca Scikit-Learn? print printf plot_tree console.log cout 4. Ref.: 6075830 Pontos: 1,00 / 1,00 O boom da IA se deve ao surgimento de novas tecnologias e dispositivos que por estarem sempre conectados produzem uma quantidade enorme de dados. Estes dados que alimentam os modelos de aprendizado de máquina também são conhecidos como: Informações. Observações. Dados Faltantes. Conhecimento. Big Data. 02508 - HADOOP E ARMAZENAMENTO DE DADOS 5. Ref.: 6076138 Pontos: 0,00 / 1,00 Em relação aos RDBMS, selecione a opção que apresenta a característica que trata as transações em um banco de dados como uma unidade indivisível. Consistência. Isolamento. Durabilidade. Indivisibilidade. Atomicidade. 6. Ref.: 6076199 Pontos: 1,00 / 1,00 O sistema de arquivos distribuídos do Hadoop, conhecido como HDFS, foi idealizado para trabalhar com grandes volumes de dados. Selecione a opção correta que apresenta o paradigma como o HDFS funciona. Distribuído e distribuído. Distribuído e centralizado. Centralizado e centralizado. Mestre e escravo. Centralizado e distribuído. 02727 - PRINCÍ PIOS DE BIG DATA 7. Ref.: 6067386 Pontos: 0,00 / 1,00 Em relação aos formatos que os dados de Big Data, selecione a opção que corresponde a quantidade de formas que podem ser encontrados. 5 4 2 3 6 8. Ref.: 6067203 Pontos: 0,00 / 1,00 Selecione a opção correta sobre o uso de Big Data. É impossível não utilizar aplicações de Big Data para gerenciar projetos de internet das coisas. Grandes volumes de dados são úteis para testar a capacidade dos servidores de gerenciamento de dados. Projetos de big de Big Data são uma forma de organizar tabelas normalizadas com grande volume de dados. Com projetos de Big Data é sempre possível detectar fraudes em operações financeiras. O volume e diversidade dos dados podem dar uma visão realística do que está sendo observado. 02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON 9. Ref.: 6075911 Pontos: 0,00 / 1,00 O Spark é um framework de alto desempenho usado para aplicações de Big Data. Em relação à arquitetura do Spark, selecione a opção correta. O Executor e os Worker Nodes desempenham papeis equivalentes na arquitetura do Spark. O gerenciador de cluster do Spark faz o gerenciamento da execução das tarefas. O Executor corresponde ao conjunto de máquina que executam como escravos. Os Worker Nodes da arquitetura Spark são responsáveis pelo gerenciamento das máquinas que executarão como escravos. O gerenciador de cluster do Spark oferece suporte a Hadoop YARN. 10. Ref.: 6076009 Pontos: 1,00 / 1,00 A biblioteca Pandas é amplamente utilizada para manipular dados heterogêneos, situação recorrente para aplicações de Big Data. Nesse sentido, selecione a opção que contém a estrutura de dados que possibilita o Cientista de dados atribuir nome para as colunas. numpy.array RDD SQL DataFrame PySpark Educational Performace Solution EPS ® - Alunos This document was created with Win2PDF available at http://www.win2pdf.com. The unregistered version of Win2PDF is for evaluation or non-commercial use only. This page will not be added after purchasing Win2PDF. http://www.win2pdf.com
Compartilhar