Baixe o app para aproveitar ainda mais
Prévia do material em texto
Disciplina: TÓPICOS DE BIG DATA EM PYTHON AVS Aluno: Professor: Turma: 27/11/2022 20:42:00 (F) Avaliação: 8,0 Av. Parcial.: 2,0 Nota SIA: 10,0 pts 02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS 1. Ref.: 6076913 Pontos: 1,00 / 1,00 A coleta e preparação dos dados para análise no Python são de extrema importância. Os dados secundários são assim definidos devido: A sua baixa qualidade. O fato de virem de uma fonte alternativa não convencional. O fato de terem sido obtidos a partir de terceiros. O fato de requererem muito mais pré-processamento. O fato de ocuparem menos espaço de memória. 2. Ref.: 6076764 Pontos: 0,00 / 1,00 A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. Sobre ela podemos afirmar que: I - O nome Pandas se refere a dados em painel ou panel data II - O DataFrame é o coletivo de listas (lists) III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de dados, principalmente CSVs, Excels, e JSONsAnalise as frases listadas e assinale a alternativa correta. Apenas II e III. Apenas II. Apenas I e II. Apenas I. Apenas I e III. 02318 - BIG DATA ANALYTICS 3. Ref.: 6075829 Pontos: 0,00 / 1,00 Alfredo começou em um laboratório de pesquisa e inovação no começo deste ano. Este laboratório investiga a relação entre trocas de mensagens em redes sociais e variações na bolsa de valores, dependendo principalmente de modelos de redes neurais recorrentes. Com qual tipo de IA Alfredo está lidando? IA SubSimbólica IA Simbólica IA Pura IA Biológica IA Quântica 4. Ref.: 6075831 Pontos: 1,00 / 1,00 Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial? KDD-DM. KDM. SIGM. CRISP-DM. SIGKDD. 02508 - HADOOP E ARMAZENAMENTO DE DADOS 5. Ref.: 6075862 Pontos: 1,00 / 1,00 Em relação aos arquivos de configuração do Hadoop, selecione a opção correta que contém o arquivo que trata das configurações do HDFS. hdfs-site.xml mapred-site.xml hadoop-env.cmd yarn-site.xml core-site.xml 6. Ref.: 6076140 Pontos: 1,00 / 1,00 Em relação à fase de mapeamento do Hadoop, selecione a opção correta que apresenta o responsável pela geração de fragmento para os componentes da fase de redução. Leitor de registros. Particionador. Redutor. Mapeador. Combinador. 02727 - PRINCÍPIOS DE BIG DATA 7. Ref.: 6067388 Pontos: 1,00 / 1,00 Em relação às aplicações de Internet das coisas, selecione a opção correta sobre os seus objetivos. Melhorar a interatividade com o usuário Ampliar o volume de dados da aplicação Obter dados que sirvam como base na tomada de decisão Aumentar a diversidade dos dados Aumentar a complexidade do processo de gestão dos dados 8. Ref.: 6067203 Pontos: 1,00 / 1,00 Selecione a opção correta sobre o uso de Big Data. Com projetos de Big Data é sempre possível detectar fraudes em operações financeiras. É impossível não utilizar aplicações de Big Data para gerenciar projetos de internet das coisas. O volume e diversidade dos dados podem dar uma visão realística do que está sendo observado. Grandes volumes de dados são úteis para testar a capacidade dos servidores de gerenciamento de dados. Projetos de big de Big Data são uma forma de organizar tabelas normalizadas com grande volume de dados. 02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON 9. Ref.: 6082368 Pontos: 1,00 / 1,00 O Apache Spark é um framework de código aberto aplicado para projetos de Big Data. Selecione a opção correta que contenha apenas funções que podem ser categorizadas como ações no Spark. collect, flatMap e sample. reduce, map e filter. take, filter e sample. first, take e reduce. count, collect e map. 10. Ref.: 6076005 Pontos: 1,00 / 1,00 As bibliotecas são coleções de subprogramas utilizados no desenvolvimento de softwares. Selecione a opção correta que contém o componente do ecossistema do Spark responsável por realizar operações paralelas em grafos. RDDs GraphX Spark Streaming Spark Core MLlib
Compartilhar