Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE ESTÁCIO DE SÁ – Campus Teresópolis Prof. M.sc. Éden Machado Disciplina: Tópicos de Big Data em Python Questionário Avaliativo 2 1. Qual o objetivo da inteligência artificial ao simular comportamentos humanos na máquina? (X) Otimizar algoritmos para que eles se adaptem a contextos não previamente codificados. ( ) Fazer com que computadores acessem a internet mais rápido. ( ) Melhorar a capacidade de processamento de dados do sistema. ( ) Incrementar o uso da memória de longa duração do sistema. ( ) Viabilizar a computação paralela. 2. Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial? ( ) KDM. ( ) SIGKDD. ( ) SIGM. (X) CRISP-DM. ( ) KDD-DM. 3. O enquadramento de aprendizado não supervisionado contempla qual(is) técnicas? I - Agrupamento II - Classificação III - Regressão (X) Apenas a opção I está correta ( ) Apenas a opção II está correta ( ) Apenas a opção III está correta ( ) Apenas as opções II e III estão corretas ( ) Apenas as opções I e III estão corretas 4. Quais os métodos de aprendizado de máquina que existem? ( ) Aprendizado Supersticioso, Não-Supervisionado, Por Reforço, e Semisupervisionado (X) Aprendizado Supervisionado, Não-Supervisionado, Por Reforço, e Semisupervisionado ( ) Aprendizado Supervisionado, Escondido, Por Reforço, e Semisupervisionado ( ) Aprendizado Supervisionado, Não-Supervisionado, Por Força Bruta, e Semisupervisionado ( ) Aprendizado Supervisionado, Não-Supervisionado, Por Reforço, e Aleatório 5. Alfredo começou em um laboratório de pesquisa e inovação no começo deste ano. Este laboratório investiga a relação entre trocas de mensagens em redes sociais e variações na bolsa de valores, dependendo principalmente de modelos de redes neurais recorrentes. Com qual tipo de IA Alfredo está lidando? ( ) IA Simbólica ( ) IA Pura ( ) IA Biológica ( ) IA Quântica (X) IA SubSimbólica 6. Dentre as inúmeras bibliotecas da linguagem Python qual destas é a que abstrai conceitos de engenharia de aprendizado de máquina e implementa modelos de ML? ( ) Numpy ( ) Pandas (X) Scikit-Learn ( ) OS ( ) BeautifulSoup 7. O boom da IA se deve ao surgimento de novas tecnologias e dispositivos que por estarem sempre conectados produzem uma quantidade enorme de dados. Estes dados que alimentam os modelos de aprendizado de máquina também são conhecidos como: ( ) Informações. ( ) Conhecimento. ( ) Dados Faltantes. (X) Big Data. ( ) Observações. 8. Selecione a opção correta que contenha a ação responsável por retornar os elementos de um conjunto de dados como um vetor. ( ) reduce (X) collect ( ) take ( ) coalesce ( ) join 9. Atualmente, o Apache Spark, é o mais bem-sucedido framework para Big Data. Selecione a opção correta que contenha apenas funções que podem ser categorizadas como transformações no Spark. ( ) count, collect e take. ( ) map, sample e collect. (X) map, filter e union. ( ) reduce, first e map. ( ) map, take e reduce. 10. O Apache Spark é um framework de código aberto aplicado para projetos de Big Data. Selecione a opção correta que contenha apenas funções que podem ser categorizadas como ações no Spark. ( ) take, filter e sample. ( ) reduce, map e filter. ( ) collect, flatMap e sample. ( ) count, collect e map. (X) first, take e reduce. 11. Selecione a opção correta que contenha a operação responsável por retornar um subconjunto aleatório dos dados de entrada. (X) sample ( ) filter ( ) random ( ) mapRandom ( ) distinct 12. O paradigma MapReduce é uma estratégia de computação com capacidade de processar grandes conjuntos de dados de maneira distribuída em várias máquinas. Em relação à técnica MapReduce, selecione a opção que é responsável por consolidar os resultados produzidos ao longo do processamento. ( ) Agregação ( ) Mapeamento ( ) Separação (X) Redução ( ) Processamento 13. O Spark é um framework de alto desempenho usado para aplicações de Big Data. Em relação à arquitetura do Spark, selecione a opção correta. ( ) Os Worker Nodes da arquitetura Spark são responsáveis pelo gerenciamento das máquinas que executarão como escravos. (X) O gerenciador de cluster do Spark oferece suporte a Hadoop YARN. ( ) O Executor corresponde ao conjunto de máquina que executam como escravos. ( ) O Executor e os Worker Nodes desempenham papeis equivalentes na arquitetura do Spark. ( ) O gerenciador de cluster do Spark faz o gerenciamento da execução das tarefas. 14. A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. Sobre ela podemos afirmar que: I - O nome Pandas se refere a dados em painel ou panel data II - O DataFrame é o coletivo de listas (lists) III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de dados, principalmente CSVs, Excels, e JSONsAnalise as frases listadas e assinale a alternativa correta. ( ) Apenas I e II. ( ) Apenas II e III. (X) Apenas I e III. ( ) Apenas I. ( ) Apenas II. 15. Dado que Felipe quer fazer a junção entre dois conjuntos de dados e escreveu o seguinte código: import pandas as pd df1 = pd.DataFrame({'lkey': ['foo', 'bar', 'baz', 'foo'], 'value': [1, 2, 3, 5]}) df2 = pd.DataFrame({'rkey': ['foo', 'bar', 'baz', 'foo'], 'value': [5, 6, 7, 8]}) df1.merge(df2, left_on='lkey', right_on='rkey') Qual destas alternativas descreve as saídas do código? I. O conjunto resultante terá colunas lkey, value_x, rkey, value_y II. O código não executará, pois Filipe não definiu os sufixos de coluna III. O resultado do código em questão retornará um pd.Series juntando os conjuntos pela lkey e rkey. (X) Apenas a opção I está correta. ( ) Apenas a opção II está correta. ( ) Apenas a opção III está correta. ( ) Apenas as opções II e III estão corretas. ( ) Apenas as opções I e III estão corretas. 16. Os dados que, por alguma razão, normalmente interferência humana, não chegam com todos os atributos esperados durante a coleta de dados, são conhecidos como: ( ) Embaralhados. ( ) Corrompidos. ( ) Nulos. ( ) Enviesados. (X) Faltantes. 17. A função de agrupamento do Pandas é o groupby, responsável por influenciar a indexação das colunas. O que acontece ao aplicarmos o método reset_index() no resultado de uma agregação? ( ) Nada, o DataFrame fica imutável. (X) Os indexes não são deletados, evitando a perda de colunas no DataFrame da agregação. ( ) As colunas de agrupamento somem, e o DataFrame passa a ser indexado pelo número da linha. ( ) O DataFrame é indexado pelas suas colunas. ( ) O DataFrame é embaralhado.
Compartilhar