Prévia do material em texto
1) A partir de seus conhecimentos sobre sistemas de recomendação, analise os itens a seguir: ( ) A fatoração matricial é uma forma de trabalhar a matriz de proximidades para poder organizar alfabeticamente os usuários. ( ) Deep learning pode ser utilizado em sistemas de recomendação para criar redes neurais relacionando usuários e objetos. ( ) A principal diferença entre métodos baseados em filtragem colaborativa e métodos baseados em conteúdo é que o primeiro estuda a interação entre usuários e objetos, ao passo que o segundo analisa as suas características. ( ) O método nearest-neighbor, quando aplicado a sistemas de recomendação baseados em filtragem colaborativa, consegue criar matrizes relacionando usuário- usuário, mas não é capaz de gerar matrizes usuário-item. Assinale a alternativa que julga corretamente as afirmações acima como verdadeiras (V) ou falsas (F). Alternativas: • V – V – V – F. • F – V – V – V. • V – V – F – F. • F – V – V – F. checkCORRETO • F – F – V – F.' Resolução comentada: ( ) A fatoração matricial é uma forma de trabalhar a matriz de proximidades, mas a organização não é feita por ordem alfabética. ( ) Deep learning pode ser utilizado em sistemas de recomendação para criar redes neurais relacionando usuários e objetos. ( ) A principal diferença entre métodos baseados em filtragem colaborativa e métodos baseados em conteúdo é que o primeiro estuda a interação entre usuários e objetos, ao passo que o segundo analisa as suas características. ( ) O método nearest-neighbor, quando aplicado a sistemas de recomendação baseados em filtragem colaborativa, consegue criar matrizes relacionando usuário- usuário e também é capaz de gerar matrizes usuário-item. Código da questão: 49633 2) A classificação binária é um dos problemas mais utilizados e estudados em aprendizado de máquina. Sobre o AM de classificação binária, analise os itens a seguir: I. O algoritmo de classificação binária estuda um padrão x contido em um domínio X, e estima qual valor uma variável aleatória binária y∈{±1} irá assumir. II. Caso não haja informação completa sobre o conjunto X de observação, o problema é conhecido como estimativa com variáveis desconhecidas. III. Caso o conjunto X observado no treinamento seja de uma fonte diferente do conjunto X' utilizado na estimação, o problema é conhecido como um problema sem covariância. Assinale a alternativa que indica quais afirmações estão corretas. Alternativas: • Somente I e III. • I – II – III. • Somente III. • Somente II. • Somente I e II. checkCORRETO Resolução comentada: as afirmativas I e II estão corretas. O correto para a afirmativa III seria: “Caso o conjunto X observado no treinamento seja de uma fonte diferente do conjunto X' utilizado na estimação, o problema é conhecido como um problema de correção de descolamento por covariância”. Código da questão: 49602 3) Considere os seguintes passos necessários para a implementação de uma árvore de decisão: A. Os dados são então divididos em seus diferentes atributos. B. Calcule a entropia do resultado esperado. C. Ramo com entropia 0 é uma folha; ramo com entropia maior do que 0 pode ser ainda mais dividida. D. Escolha o atributo com o maior ganho de informação como o nó de decisão. Alternativas: • C – A – D – B. • D – B – C – A. • B – A – C – D. • A – B – C – D. • B – A – D – C. checkCORRETO Resolução comentada: a sequência correta é B – A – D – C: B. Calcule a entropia do resultado esperado. A. Os dados são então divididos em seus diferentes atributos. D. Escolha o atributo com o maior ganho de informação como o nó de decisão. C. Ramo com entropia 0 é uma folha; ramo com entropia maior do que 0 pode ser ainda mais dividida. Código da questão: 49619 4) Um _____________________ analisa similaridades entre as interações usuário-item, item- item e usuário-usuário. Uma vez que o sistema identifica similaridades, ele consegue fazer recomendações a novos usuários. Geralmente, usuários acessam itens que outros usuários semelhantes gostaram. Assinale a alternativa que preenche corretamente a lacuna do trecho acima. Alternativas: • Sistema de recomendação baseado em conteúdo. • Sistema de recomendação por filtragem colaborativa. checkCORRETO • Sistema de conteúdo baseado em recomendação. • Sistema de recomendação discriminativo. • Sistema de recomendação por filtragem não colaborativa. Resolução comentada: O correto é: Um sistema de recomendação por filtragem colaborativa analisa similaridades entre as interações usuário-item, item-item e usuário-usuário. Uma vez que o sistema identifica similaridades, ele consegue fazer recomendações a novos usuários. Geralmente, usuários acessam itens dos quais outros usuários semelhantes gostaram. Código da questão: 49631 5) O algoritmo kNN possui como característica principal a análise de distância entre objetos. Você observou durante os estudos que o valor do parâmetro k pode influenciar significativamente no desempenho do algoritmo e até mudar o resultado obtido. Assinale a alternativa que define corretamente o que é o parâmetro k em um algoritmo kNN. Alternativas: • O parâmetro k representa a quantidade de objetos que o algoritmo consegue processar simultaneamente. • O parâmetro k representa o grau do polinômio criado pelo algoritmo. • É o grau de liberdade computacional do algoritmo a ser implementado. • É o número de pontos existentes no domínio do problema. • É o número de vizinhos próximos que são considerados para tomar a decisão sobre a definição da classe do objeto. checkCORRETO Resolução comentada: o parâmetro k representa o número de vizinhos próximos que são considerados para tomar a decisão sobre a definição da classe do objeto. Código da questão: 49610 6) Existem inúmeros algoritmos de aprendizado de máquina, e cada um é mais indicado para um determinado tipo de dados. Existe um algoritmo que é normalmente sensível quanto à posição das sementes iniciais, o que pode levar para uma convergência local. Esse algoritmo é também sensível a ruídos, dado que ele leva em consideração os desvios dos objetos em relação ao centroide de cada cluster calculado. Por último, esse algoritmo não é indicado para o caso de os clusters possuírem forma não convexa. Assinale a alternativa que contém o nome correto do algoritmo descrito pelo texto acima. Alternativas: • Support vector machine. • Random Forest. • Rede neural. • Algoritmo genético. • K-means. checkCORRETO Resolução comentada: o trecho se refere ao algoritmo K-means. Código da questão: 49624 7) Uma determinada instituição bancária contratou um programador para desenvolver algoritmos de machine learning para classificar os clientes como “BOM” ou “MAU” de acordo com saldo diário de sua conta durante um ano todo. Os clientes com classificação “BOM” serão convidados para receber um cartão OURO. Para essa tarefa, o programador recebeu apenas um banco de dados com 10.000 clientes já classificados pelos gerentes do banco. O banco de dados contém o saldo diário da conta (365 campos de informação) e a classificação como “BOM” ou “MAU” cliente. Considerando o cenário acima: I. É aconselhável utilizar um algoritmo supervisionado. PORQUE II. Os dados de treinamento fornecidos possuem seus respectivos rótulos e o algoritmo só precisa aprender e gerar uma função capaz de predizer o rótulo correto do cliente. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: • A primeira asserção está incorreta e a segunda está correta. • A primeira e a segunda asserção estão corretas, mas a segunda não justifica a primeira. • A primeira e a segunda asserção estão corretas e a segunda justifica a primeira. checkCORRETO • A primeira asserção está correta e a segundaestá incorreta. • As duas asserções estão incorretas. Resolução comentada: ambas as asserções estão corretas e a segunda justifica a primeira. Código da questão: 49604 8) O Algoritmo Naive Bayes foi criado com sus estrutura baseada no Teorema de Bayes, que diz o seguinte: Considere a seguinte situação: Alternativas: • • • • • checkCORRETO Resolução comentada: Código da questão: 49611 9) João aplicou um teste de múltipla escolha contendo 120 questões para um grande grupo de pessoas, e conseguiu perceber que houve uma grande variação na distribuição das notas. João resolveu, então, utilizar um algoritmo para agrupar os alunos, para que cada aluno pudesse ficar no grupo mais indicado, de acordo com sua nota. Dessa forma, ele poderá elaborar trabalhos específicos para cada grupo. Assinale a alternativa que contém o algoritmo mais indicado para a realização desse agrupamento. Alternativas: • Regressão linear. • Regressão multivariável. • Regressão logística. • Monte Carlo. • K-means. checkCORRETO Resolução comentada: dentre as alternativas, o único algoritmo que faz o agrupamento, ou clustering, é o k- means. Código da questão: 49623 10) Observe a figura que contém a estrutura de uma rede neural artificial: Fonte: elaborada pelo autor. Sobre a RNA descrita na figura, analise as afirmativas I a IV a seguir: I. A RNA admite quatro sinais de entrada (input layer). II. A RNA não possui camadas intermediárias. III. A RNA da figura é apropriada para aplicações deep learning. IV. A RNA possui três variáveis de bias. Sendo assim, estão CORRETOS somente os itens: Alternativas: • IV. checkCORRETO • II – III. • I – II – III. • I. • I – II. Resolução comentada: I. A RNA admite três sinais de entrada (input layer). II. A RNA possui duas camadas intermediárias. III. A RNA da figura não é apropriada para aplicações deep learning. IV. A RNA possui três variáveis de bias. Código da questão: 49625