Baixe o app para aproveitar ainda mais
Prévia do material em texto
Avaliação On-line - Processamento de dados massivos e Modelos de Aprendizado [3ª Tentativa] QUESTÃO 1 Considere o seguinte script em SQL: CREATE TABLE "Empresa"."FUNCIONARIO" ( "ID_FUNC" NUMBER, "NOMEFUNC" VARCHAR2(30 BYTE), "ENDERECO" VARCHAR2(50 BYTE), "DATANASC" DATE, "SEXO" CHAR(1 BYTE), "SALARIO" NUMBER(8,2), "ID_SUPERV" NUMBER(4,0), "ID_DEPTO" NUMBER(2,0), PRIMARY KEY ("ID_FUNC") ); Será criada uma tabela com uma chave estrangeira. O atributo ID_FUNC pode possuir o mesmo valor em tuplas diferentes da tabela FUNCIONÁRIO. Cada atributo será uma linha na tabela FUNCIONÁRIO. O atributo ID_FUNC é uma chave estrangeira. O atributo ID_FUNC apenas pode assumir valores únicos. QUESTÃO 2 Sistemas de recomendação baseados em conteúdo analisam um conjunto de itens que representam os interesses de um usuário e constroem um modelo que representa o seu perfil com base em características do conteúdo de seus itens de interesse. A tabela abaixo apresenta uma base de dados de filmes com 3 itens, com informações do código e título dos filmes. Código Título 1 O Senhor dos Anéis 2 O Senhor das Armas 3 O Senhor das Moscas Considerando as informações apresentadas, é correto afirmar que Um sistema de recomendação baseado em conteúdo precisa considerar as avaliações dos usuários para gerar recomendações. Um sistema de recomendação pode considerar o conteúdo dos itens, as avaliações dos usuários ou uma combinação entre elas para identificar as recomendações de cada usuário. Um sistema de recomendação com filtragem colaborativa considera o conteúdo dos itens para colaborar com o processo de recomendação. O sistema de recomendação baseado em conteúdo não consegue realizar recomendações quando não possui o feedback do usuário Um sistema de recomendação não pode ser aplicado em alguns tipos de itens, tais como imagem e vídeo. QUESTÃO 3 Considere a coleção nomeado como BancoMongo abaixo. Proveniência Quantidade Espécie 1 Rio de Janeiro 10 rato 2 São Paulo 1 macaco 3 Minas Gerais 100 macaco Considerando a coleção apresentada, o script em Mongo responsável por recuperar o segundo registro é. db.BancoMongo.find( { id: 2 } ) db.BancoMongo.find( { São Paulo: 'Proveniência' } ) db.BancoMongo.find( { Proveniência: 'macaco' } ) db.BancoMongo.find( { São Paulo: 'Proveniência' and Espécie: 'macaco'} ) db.BancoMongo.find( { Proveniência: 'São Paulo' } ) QUESTÃO 4 Redes neurais convolucionais (convolutional neural networks, CNN) se inspiram no funcionamento do córtex visual. Esse tipo de rede neural é utilizada em três cenários, sendo eles: extração de características; mapeamento de características; subamostragem. Considerando as informações apresentadas, é correto afirmar que Redes Neurais podem ser utilizadas para processamento de dados textuais. Deep Learning representa um conjunto de técnicas cujo objetivo é aplicar uma rede neurais com camada única. Um extrator de características permite aplicar validação cruzada para dividir uma amostra de dados. Subamostragem é uma técnica convolucional. Subamostragem é uma técnica de regressão linear. QUESTÃO 5 Análise de agrupamento, ou clustering, é o nome dado para o grupo de técnicas computacionais cujo propósito consiste em separar objetos em grupos, baseando-se nas características que estes objetos possuem. Considerando o texto apresentado, avalie as afirmações a seguir. I. O K-Means é uma heurística de agrupamento que busca minimizar a distância dos elementos em relação a um conjunto de k centro. II. Máquina de vetores de suporte é uma técnica de aprendizagem de máquina derivada de duas fundamentações sólidas. III. Caso o conjunto de dados seja muito grande, o custo (tempo) do treinamento do SVM será elevado. Performance da técnica não é ruim em casos em que há muitos ruídos no conjunto de dados. É correto o que se afirma em I, apenas II e III, apenas III, apenas I, II e III I e II, apenas QUESTÃO 6 A linguagem utilizada para manipulação de dados em um SGBD( Sistema de Gerenciamento de Banco de Dados) é a linguagem SQL (Structured Query Language), desenvolvida pela IBM na década de 1970 em um projeto chamado R, a fim de implementar o modelo relacional. O nome dado a essa linguagem, inicialmente, foi Structured English Query Language (SEQUEL). Por ter sido bem aceita pela comunidade científica, logo foi lançada no mercado. Considerando o texto apresentado, avalie o trecho de código em SQL. SELECT FUNCIONARIO.nome, FUNCIONARIO.salario, FUNCIONARIO.cargo, DEPARTAMENTO.nome FROM FUNCIONARIO, DEPARTAMENTO WHERE FUNCIONARIO.idDEPT = DEPARTAMENTO.id A partir das informações apresentadas, avalie as afirmações a seguir. I. FUNCIONÁRIO e DEPARTAMENTO são considerados colunas das tabelas envolvidas no script apresentado. II. O script não irá funcionar, pois existem duas linhas com o termo nome. III. Os termos nome, salario e cargo são colunas pertencentes às tabelas envolvidas no script. É correto o que se afirma em I, apenas. II e III, apenas III, apenas. I, II e III. I e II, apenas. QUESTÃO 7 ADAPTADA 2016, FGV) Considere as seguintes características de um projeto de banco de dados. a. O modelo de dados é conhecido e estável; b. A integridade dos dados é essencial para o modelo; c. Velocidade e escalabilidade são preponderantes. d. A segurança dos dados deve ser garantida. Considerando as informações apresentadas, avalie as afirmações a seguir. I. Os itens a e b justificam a utilização de modelagem não relacional, uma vez que estabilidade e integridade são as principais características deste tipo de modelo. II. De acordo com o que podemos conferir em sites, por exemplo, da Amazon, bancos de dados NoSQL são criados para modelos específicos e têm esquemas flexíveis para a criação de aplicativos modernos. Os bancos de dados NoSQL são reconhecidos por sua facilidade de desenvolvimento, funcionalidade e performance em escala. III. Esta categoria de banco de dados é otimizada especificamente para aplicativos que exigem modelos de grande volume de dados, baixa latência e flexibilidade. É correto o que se afirma em I, apenas II e III, apenas I e II,apenas I, II e III. III, apenas QUESTÃO 8 Uma das áreas de pesquisa incluídas em aprendizagem de máquina é a habilidade de simular a capacidade cognitiva do ser humano. A inteligência do ser humano é a mais avançada dentro do universo das criaturas e a responsável por esta inteligência é o cérebro. Redes neurais artificiais (RNA) são utilizadas para simular o funcionamento do cérebro humano e, com isso, seu objetivo é construir um artefato de software capaz de tomar decisões de forma similar ao ser humano. Considere o texto apresentado e avalie as asserções abaixo e a relação proposta entre elas. I. Um neurônio computacional visa simular o funcionamento do seu modelo biológico. PORQUE II. Uma das áreas de pesquisa incluídas em aprendizagem de máquina é a habilidade de simular a capacidade cognitiva do ser humano. A inteligência do ser humano é a mais avançada dentro do universo das criaturas e a responsável por esta inteligência é o cérebro. Redes neurais artificiais (RNA) são utilizadas para simular o funcionamento do cérebro humano e, com isso, seu objetivo é construir um artefato de software capaz de tomar decisões de forma similar ao ser humano. A respeito dessas asserções, assinale a opção correta. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. A asserção II é uma proposição verdadeira e a I é uma proposição falsa. As asserções I e II são proposições verdadeiras, mas II não é uma justificativa correta da I. As asserções I e II são proposições falsas A asserção I é uma proposição verdadeira e a II é uma proposição falsa. QUESTÃO 9 Bancos de dados relacionais guardam informações em tabelas que organizam os dados em linhas e colunas. Uma modelagem relacional guarda a relação entre tabelas por meio de chaves que são responsáveis por unir diferentes tabelas dentro de um mesmo negócio. É crucial entender as diferençasentre as abordagens relacional e NoSQL, uma vez que o NoSQL está mais preocupado com a simplicidade e velocidade de acesso aos dados. Considerando o texto apresentado, avalie as afirmações a seguir. I. Uma modelagem NoSQL possui cargas de trabalho de alto volume que exigem grande escala. II. A modelagem relacional são caracterizados por possuir dados previsíveis e altamente estruturados. III. A modelagem não relacional trabalha com consultas e relatórios complexos. É correto o que se afirma em I, apenas. II e III, apenas III, apenas I, II e III I e II, apenas. QUESTÃO 10 O Banco de dados NoSql é usado para descrever esquemas de armazenamento de dados não-relacionais e sem esquemas. Com sua criação liderada por Carlo Strozzi, esse banco de dados armazena suas coleções sob a forma de arquivos ASCII, e cada tupla é representada por uma linha com os campos separados por tabulações. Para acesso aos registros, é necessário uma linguagem de dados específica. Desta forma, marque a opção onde a sintaxe esteja correta para recuperar um determinado registro em uma coleção no banco de dados MongoDB. select * from colecao select * from db.colecao select * colecao from Nenhuma das alternativas acima. db.colecao.find( { id: numero } )
Compartilhar