Prévia do material em texto
O sistema de arquivos distribuídos do Hadoop, conhecido como HDFS, foi idealizado para trabalhar com grandes volumes de dados. Selecione a opção correta que apresenta o paradigma como o HDFS funciona. Centralizado e distribuído. Centralizado e centralizado. Distribuído e centralizado. Mestre e escravo. Distribuído e distribuído. O Apache Spark é um framework de código aberto aplicado para projetos de Big Data. Selecione a opção correta que contenha apenas funções que podem ser categorizadas como ações no Spark. count, collect e map. take, filter e sample. collect, flatMap e sample. reduce, map e filter. first, take e reduce. O Spark é um framework de alto desempenho usado para aplicações de Big Data. Em relação à arquitetura do Spark, selecione a opção correta. Os Worker Nodes da arquitetura Spark são responsáveis pelo gerenciamento das máquinas que executarão como escravos. O Executor e os Worker Nodes desempenham papeis equivalentes na arquitetura do Spark. O gerenciador de cluster do Spark oferece suporte a Hadoop YARN. O gerenciador de cluster do Spark faz o gerenciamento da execução das tarefas. O Executor corresponde ao conjunto de máquina que executam como escravos. A coleta e preparação dos dados para análise no Python são de extrema importância. Os dados secundários são assim definidos devido: O fato de requererem muito mais pré-processamento. O fato de ocuparem menos espaço de memória. A sua baixa qualidade. O fato de virem de uma fonte alternativa não convencional. O fato de terem sido obtidos a partir de terceiros. 5 a Questão ( Ref.: 202009312732) 6 a Questão ( Ref.: 202009306275) 7 a Questão ( Ref.: 202009307277) 8 a Questão ( Ref.: 202009306992) O seguinte constructo da linguagem Python representa o condicional simples: while with if for else 4 a Questão ( Ref.: 202009306563) 9a Questão (Ref.: 202009306194) O boom da IA se deve ao surgimento de novas tecnologias e dispositivos que por estarem sempre conectados produzem uma quantidade enorme de dados. Estes dados que alimentam os modelos de aprendizado de máquina também são conhecidos como: Observações. Conhecimento. Informações. Big Data. Dados Faltantes. 10 a Questão ( Ref.: 202009306192) Os modelos simbólicos são aqueles que: Se baseiam em táticas de agrupamento por similaridade São aqueles que só lidam com problemas categóricos Se baseiam em lógica e regras de inferência para aprender e raciocinar São aqueles que lidam apenas com problemas numéricos Se baseiam estritamente em dados e inferências estatísticas em cima deles