Buscar

Questionário avaliativo 2 -Tópicos de Big data em Python NOTA 10

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

UNIVERSIDADE ESTÁCIO DE SÁ – Campus Teresópolis 
Prof. M.sc. Éden Machado
Disciplina: Tópicos de Big Data em Python
Questionário Avaliativo 2
1. Qual o objetivo da inteligência artificial ao simular comportamentos humanos na máquina?
(X) Otimizar algoritmos para que eles se adaptem a contextos não previamente codificados.
( ) Fazer com que computadores acessem a internet mais rápido.
( ) Melhorar a capacidade de processamento de dados do sistema.
( ) Incrementar o uso da memória de longa duração do sistema.
( ) Viabilizar a computação paralela.
2. Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial?
( ) KDM.	
( ) SIGKDD.	
( ) SIGM.	
(X) CRISP-DM.
( ) KDD-DM.
3. O enquadramento de aprendizado não supervisionado contempla qual(is) técnicas?
I - Agrupamento
II - Classificação
III - Regressão
(X) Apenas a opção I está correta
( ) Apenas a opção II está correta
( ) Apenas a opção III está correta
( ) Apenas as opções II e III estão corretas
( ) Apenas as opções I e III estão corretas
4. Quais os métodos de aprendizado de máquina que existem?
	
( ) Aprendizado Supersticioso, Não-Supervisionado, Por Reforço, e Semisupervisionado
(X) Aprendizado Supervisionado, Não-Supervisionado, Por Reforço, e Semisupervisionado
( ) Aprendizado Supervisionado, Escondido, Por Reforço, e Semisupervisionado
( ) Aprendizado Supervisionado, Não-Supervisionado, Por Força Bruta, e Semisupervisionado
( ) Aprendizado Supervisionado, Não-Supervisionado, Por Reforço, e Aleatório
5. Alfredo começou em um laboratório de pesquisa e inovação no começo deste ano. Este laboratório investiga a relação entre trocas de mensagens em redes sociais e variações na bolsa de valores, dependendo principalmente de modelos de redes neurais recorrentes. Com qual tipo de IA Alfredo está lidando?
( ) IA Simbólica
( ) IA Pura
( ) IA Biológica
( ) IA Quântica
(X) IA SubSimbólica
6. Dentre as inúmeras bibliotecas da linguagem Python qual destas é a que abstrai conceitos de engenharia de aprendizado de máquina e implementa modelos de ML? 
( ) Numpy
( ) Pandas
(X) Scikit-Learn 
( ) OS
( ) BeautifulSoup
7. O boom da IA se deve ao surgimento de novas tecnologias e dispositivos que por estarem sempre conectados produzem uma quantidade enorme de dados. Estes dados que alimentam os modelos de aprendizado de máquina também são conhecidos como:
( ) Informações.
( ) Conhecimento.
( ) Dados Faltantes.
(X) Big Data.
( ) Observações.
8. Selecione a opção correta que contenha a ação responsável por retornar os elementos de um conjunto de dados como um vetor.
( ) reduce
(X) collect
( ) take
( ) coalesce
( ) join
9. Atualmente, o Apache Spark, é o mais bem-sucedido framework para Big Data. Selecione a opção correta que contenha apenas funções que podem ser categorizadas como transformações no Spark.
( ) count, collect e take.
( ) map, sample e collect.
(X) map, filter e union.
( ) reduce, first e map.
( ) map, take e reduce.
10. O Apache Spark é um framework de código aberto aplicado para projetos de Big Data. Selecione a opção correta que contenha apenas funções que podem ser categorizadas como ações no Spark.
( ) take, filter e sample.
( ) reduce, map e filter.
( ) collect, flatMap e sample.
( ) count, collect e map.
(X) first, take e reduce.
11. Selecione a opção correta que contenha a operação responsável por retornar um subconjunto aleatório dos dados de entrada.
(X) sample
( ) filter
( ) random
( ) mapRandom
( ) distinct
12. O paradigma MapReduce é uma estratégia de computação com capacidade de processar grandes conjuntos de dados de maneira distribuída em várias máquinas. Em relação à técnica MapReduce, selecione a opção que é responsável por consolidar os resultados produzidos ao longo do processamento.
( ) Agregação
( ) Mapeamento
( ) Separação
(X) Redução
( ) Processamento
13. O Spark é um framework de alto desempenho usado para aplicações de Big Data. Em relação à arquitetura do Spark, selecione a opção correta.
( ) Os Worker Nodes da arquitetura Spark são responsáveis pelo gerenciamento das máquinas que executarão como escravos.
(X) O gerenciador de cluster do Spark oferece suporte a Hadoop YARN.
( ) O Executor corresponde ao conjunto de máquina que executam como escravos.
( ) O Executor e os Worker Nodes desempenham papeis equivalentes na arquitetura do Spark.
( ) O gerenciador de cluster do Spark faz o gerenciamento da execução das tarefas.
14. A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. Sobre ela podemos afirmar que:
I - O nome Pandas se refere a dados em painel ou panel data
II - O DataFrame é o coletivo de listas (lists)
III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de dados, principalmente CSVs, Excels, e JSONsAnalise as frases listadas e assinale a alternativa correta.
( ) Apenas I e II.
( ) Apenas II e III.
(X) Apenas I e III.
( ) Apenas I.
( ) Apenas II.
15. Dado que Felipe quer fazer a junção entre dois conjuntos de dados e escreveu o seguinte código:
import pandas as pd
df1 = pd.DataFrame({'lkey': ['foo', 'bar', 'baz', 'foo'], 'value': [1, 2, 3, 5]})
df2 = pd.DataFrame({'rkey': ['foo', 'bar', 'baz', 'foo'], 'value': [5, 6, 7, 8]})
df1.merge(df2, left_on='lkey', right_on='rkey')
Qual destas alternativas descreve as saídas do código?
I. O conjunto resultante terá colunas lkey, value_x, rkey, value_y
II. O código não executará, pois Filipe não definiu os sufixos de coluna
III. O resultado do código em questão retornará um pd.Series juntando os conjuntos pela lkey e rkey.
(X) Apenas a opção I está correta.
( ) Apenas a opção II está correta.
( ) Apenas a opção III está correta.
( ) Apenas as opções II e III estão corretas.
( ) Apenas as opções I e III estão corretas.
16. Os dados que, por alguma razão, normalmente interferência humana, não chegam com todos os atributos esperados durante a coleta de dados, são conhecidos como:
( ) Embaralhados.
( ) Corrompidos.
( ) Nulos.
( ) Enviesados.
(X) Faltantes.
17. A função de agrupamento do Pandas é o groupby, responsável por influenciar a indexação das colunas. O que acontece ao aplicarmos o método reset_index() no resultado de uma agregação?
( ) Nada, o DataFrame fica imutável.
(X) Os indexes não são deletados, evitando a perda de colunas no DataFrame da agregação.
( ) As colunas de agrupamento somem, e o DataFrame passa a ser indexado pelo número da linha.
( ) O DataFrame é indexado pelas suas colunas.
( ) O DataFrame é embaralhado.

Continue navegando