Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! 1) Técnicas de machine learning podem ser utilizadas para inúmeras finalidades. A seguir, você pode verificar graficamente uma solução que relaciona estilos de escrita e alguns livros famosos: Figura 1 – Ilustração de metodologia de representação gráfica para a relação entre objetos e suas características principais Fonte: adaptada de Gormley (2017). Descrição: esta figura contém uma representação utilizada para relacionar seis obras literárias e seus respectivos estilos. A Figura 1 contém a relação entre obras literárias e suas características; porém, elas estão divididas em duas etapas, sendo que a segunda é uma aproximação da primeira, utilizada para simplificar a análise. Essa aproximação é uma técnica bastante utilizada para a manipulação de dados em sistemas de recomendação. Sendo assim, assinale a alternativa que contém o nome correto da técnica representada pela Figura 1. Alternativas: ● Recomendação por filtragem baseada em conteúdo com métodos híbridos. ● Recomendação por filtragem colaborativa baseada em métodos de relações de conteúdos. ● Recomendação por filtragem colaborativa baseada em métodos de aprendizado profundo. ● Recomendação por filtragem colaborativa baseada em métodos de fatoração matricial.checkCORRETO ● Recomendação por filtragem colaborativa baseada em métodos de inversão matricial. Resolução comentada: a figura contém claramente uma fatoração matricial. A matriz inicial, de dimensão elevada, é manipulada de tal forma a ser fatorada para então poder ser representada pela multiplicação entre as matrizes e . Com isso, a fatoração fica da seguinte forma: Código da questão: 49634 2) A partir de seus conhecimentos sobre sistemas de recomendação, analise os itens a seguir: ( ) A fatoração matricial é uma forma de trabalhar a matriz de proximidades para poder organizar alfabeticamente os usuários. ( ) Deep learning pode ser utilizado em sistemas de recomendação para criar redes neurais relacionando usuários e objetos. ( ) A principal diferença entre métodos baseados em filtragem colaborativa e métodos baseados em conteúdo é que o primeiro estuda a interação entre usuários e objetos, ao passo que o segundo analisa as suas características. ( ) O método nearest-neighbor, quando aplicado a sistemas de recomendação baseados em filtragem colaborativa, consegue criar matrizes relacionando usuário-usuário, mas não é capaz de gerar matrizes usuário-item. Assinale a alternativa que julga corretamente as afirmações acima como verdadeiras (V) ou falsas (F). Alternativas: ● F – V – V – V. ● F – F – V – F.' ● V – V – F – F. ● F – V – V – F.checkCORRETO ● V – V – V – F. Resolução comentada: ( ) A fatoração matricial é uma forma de trabalhar a matriz de proximidades, mas a organização não é feita por ordem alfabética. ( ) Deep learning pode ser utilizado em sistemas de recomendação para criar redes neurais relacionando usuários e objetos. ( ) A principal diferença entre métodos baseados em filtragem colaborativa e métodos baseados em conteúdo é que o primeiro estuda a interação entre usuários e objetos, ao passo que o segundo analisa as suas características. ( ) O método nearest-neighbor, quando aplicado a sistemas de recomendação baseados em filtragem colaborativa, consegue criar matrizes relacionando usuário-usuário e também é capaz de gerar matrizes usuário-item. Código da questão: 49633 3) Um projetista resolveu utilizar seus conhecimentos para a criação de um chatbot, que tem como função simular o ser humano em uma conversação escrita. Para isso, ele deverá utilizar o ________________, que é uma técnica de machine learning, e um de seus principais algoritmos é o ________________. Assinale a alternativa que preenche corretamente as lacunas. Alternativas: ● Mineração de dados; HTML. ● Processamento em linguagem natural; N-gram.checkCORRETO ● Processamento em linguagem formal; Python. ● Mineração de dados; N-gram ● Processamento em linguagem natural; HTML. Resolução comentada: um projetista resolveu utilizar seus conhecimentos para a criação de um chatbot, que tem como função simular o ser humano em uma conversação escrita. Para isso, ele deverá utilizar o processamento em linguagem natural, que é uma técnica de machine learning, e um de seus principais algoritmos é o N-gram. Código da questão: 49621 4) A classificação binária é um dos problemas mais utilizados e estudados em aprendizado de máquina. Sobre o AM de classificação binária, analise os itens a seguir: I. O algoritmo de classificação binária estuda um padrão x contido em um domínio X, e estima qual valor uma variável aleatória binária y∈{±1} irá assumir. II. Caso não haja informação completa sobre o conjunto X de observação, o problema é conhecido como estimativa com variáveis desconhecidas. III. Caso o conjunto X observado no treinamento seja de uma fonte diferente do conjunto X' utilizado na estimação, o problema é conhecido como um problema sem covariância. Assinale a alternativa que indica quais afirmações estão corretas. Alternativas: ● Somente I e III. ● Somente II. ● Somente I e II.checkCORRETO ● Somente III. ● I – II – III. Resolução comentada: as afirmativas I e II estão corretas. O correto para a afirmativa III seria: “Caso o conjunto X observado no treinamento seja de uma fonte diferente do conjunto X' utilizado na estimação, o problema é conhecido como um problema de correção de descolamento por covariância”. Código da questão: 49602 5) Existe uma classe de aprendizado de máquina (AM) que busca analisar um conjunto de dados D={(x_i,f(x_i )),i=1,…,n}, sendo f(x_i ) uma função desconhecida, para poder criar uma aproximação f ̂(x_i ) capaz de estimar rótulos para novas entradas. Assinale a alternativa que afirma corretamente qual é essa classe de aprendizado de máquina. Alternativas: ● AM descritivo. ● AM de agrupamento. ● AM associativo. ● AM preditivo.checkCORRETO ● AM julgativo. Resolução comentada: considere o conjunto de pares de dados como D={(x_i,f(x_i )),i=1,…,n}, sendo que f("x" _i ) é uma função desconhecida. O algoritmo de AM preditivo analisa então esse conjunto para criar uma aproximação f ̂ de f. Com essa aproximação, o algoritmo consegue, então, estimar os rótulos para qualquer nova entrada "x" Código da questão: 49606 6) Existem inúmeras técnicas de agrupamento para serem aplicadas na resolução de problema com machine learning e mineração de dados. Sobre as técnicas de agrupamento não hierárquico, analise as afirmativas a seguir: ( ) A escolha inicial dos objetos a serem utilizados no algoritmo K-means não influencia no resultado final, uma vez que essa técnica é robusta e imune a ótimos locais. ( ) No algoritmo K-médias, cada objeto do domínio pode mudar de cluster K vezes. ( ) Dendogramas são gráficos que mostram como foi a evolução dos clusters formados pelo K-means. Assinale a alternativa que julga corretamente os itens, na sequência: Alternativas: ● V – F – V. ● V – V – F. ● V – F – F. ● F – F – F.checkCORRETO ● F – V – V. Resolução comentada: a semente inicial influencia bastante no resultado obtido. No K-means, os objetos podem mudar de grupo quantas vezes forem necessárias, até que o critério de parada seja atingido. Dendograma é utilizado para visualizar o processo de clusterização passo a passo, assim como analisar os níveis de distância dos clusters formados. Código da questão: 49622 7) Em uma determinada aplicação de aprendizado de máquina, foi necessário criar um algoritmo capaz de examinar as características dos dados inseridos e então atribuir um ou mais rótulos a esses dados. Além disso, o algoritmo era supervisionado.Esse algoritmo pode ser considerado um tipo de aprendizado de máquina de topologia de ________. Assinale a alternativa que preenche corretamente a lacuna presente no texto. Alternativas: ● Recomendação. ● Regressão. ● Deep learning. ● Classificação.checkCORRETO ● Árvore de decisão. Resolução comentada: preenchendo a lacuna, temos: “Esse algoritmo pode ser considerado um tipo de aprendizado de máquina de topologia de classificação”. Código da questão: 49601 8) Alternativas: ● As entradas da matriz de preferência podem ser somente numéricas, e não binárias. ● Os algoritmos de recomendação baseados em filtragem colaborativa precisam, de alguma forma, manipular a matriz de preferências, e a recomendação baseada em conteúdo é uma técnica utilizada para realizar essa tarefa. ● Os algoritmos de recomendação baseados em filtragem colaborativa precisam, de alguma forma, manipular a matriz de preferências, e a decomposição SVD (singular value decomposition) é uma técnica utilizada para realizar essa tarefa.checkCORRETO ● Os algoritmos de deep learning não podem ser aplicados a sistemas de recomendação que utilizam métodos de filtragem colaborativa. ● As matrizes de preferências resultantes do estudo de grandes lojas virtuais, como a Amazon, costumam ser compostas por poucas linhas e colunas. Resolução comentada: a) A recomendação baseada em conteúdo é outra metodologia utilizada para fazer a recomendação c) Os algoritmos de deep learning podem ser aplicados a sistemas de recomendação que utilizam métodos de filtragem colaborativa. d) As entradas da matriz podem ser tanto numéricas (a nota dada para uma comida pelo aplicativo de celular) como binárias (se o cliente comprou determinado produto ou clicou em algum link). e) As matrizes de preferências resultantes do estudo de grandes lojas virtuais, como a Amazon, costumam ser compostas por poucas linhas e colunas. Código da questão: 49630 9) Uma determinada instituição bancária contratou um programador para desenvolver algoritmos de machine learning para classificar os clientes como “BOM” ou “MAU” de acordo com saldo diário de sua conta durante um ano todo. Os clientes com classificação “BOM” serão convidados para receber um cartão OURO. Para essa tarefa, o programador recebeu apenas um banco de dados com 10.000 clientes já classificados pelos gerentes do banco. O banco de dados contém o saldo diário da conta (365 campos de informação) e a classificação como “BOM” ou “MAU” cliente. Considerando o cenário acima: I. É aconselhável utilizar um algoritmo supervisionado. PORQUE II. Os dados de treinamento fornecidos possuem seus respectivos rótulos e o algoritmo só precisa aprender e gerar uma função capaz de predizer o rótulo correto do cliente. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: ● A primeira asserção está incorreta e a segunda está correta. ● As duas asserções estão incorretas. ● A primeira e a segunda asserção estão corretas, mas a segunda não justifica a primeira. ● A primeira asserção está correta e a segunda está incorreta. ● A primeira e a segunda asserção estão corretas e a segunda justifica a primeira.checkCORRETO Resolução comentada: ambas as asserções estão corretas e a segunda justifica a primeira. Código da questão: 49604 10) Existem inúmeros algoritmos de aprendizado de máquina, e cada um é mais indicado para um determinado tipo de dados. Existe um algoritmo que é normalmente sensível quanto à posição das sementes iniciais, o que pode levar para uma convergência local. Esse algoritmo é também sensível a ruídos, dado que ele leva em consideração os desvios dos objetos em relação ao centroide de cada cluster calculado. Por último, esse algoritmo não é indicado para o caso de os clusters possuírem forma não convexa. Assinale a alternativa que contém o nome correto do algoritmo descrito pelo texto acima. Alternativas: ● Random Forest. ● K-means.checkCORRETO ● Support vector machine. ● Algoritmo genético. ● Rede neural. Resolução comentada: o trecho se refere ao algoritmo K-means. Código da questão: 49624
Compartilhar