Baixe o app para aproveitar ainda mais
Prévia do material em texto
Machine Learning Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! 1) Um tipo de metodologia para o aprendizado de máquina é o AM preditivo baseado em probabilidades. A respeito dos métodos probabilísticos de AM, julgue os itens a seguir como verdadeiros (V) ou falsos (F): ( ) Métodos probabilísticos são utilizados quando não há informação completa sobre os dados a serem utilizados. ( ) Métodos probabilísticos utilizam probabilidades a priori e verossimilhança entre eventos para poder fazer predições. ( ) O algoritmo mais popular que é baseado em métodos probabilístico que é o Naive Bayes, também conhecido como Bayes Ingênuo ou Bayes simples. Classifique as afirmações como verdadeiro (V) e falso (F) e assinale a alternativa que contenha a sequência correta, respectivamente, de cima para baixo. Alternativas: V – V – F. F – V – F. V – V – V. CORRETO V – F – F. V – F – V. Resolução comentada: todas as alternativas contêm afirmações corretas. Código da questão: 49608 2) O algoritmo kNN possui como característica principal a análise de distância entre objetos. Você observou durante os estudos que o valor do parâmetro k pode influenciar significativamente no desempenho do algoritmo e até mudar o resultado obtido. Assinale a alternativa que define corretamente o que é o parâmetro k em um algoritmo kNN. Alternativas: É o número de pontos existentes no domínio do problema. É o grau de liberdade computacional do algoritmo a ser implementado. É o número de vizinhos próximos que são considerados para tomar a decisão sobre a definição da classe do objeto. CORRETO O parâmetro k representa o grau do polinômio criado pelo algoritmo. O parâmetro k representa a quantidade de objetos que o algoritmo consegue processar simultaneamente. Resolução comentada: o parâmetro k representa o número de vizinhos próximos que são considerados para tomar a decisão sobre a definição da classe do objeto. Código da questão: 49610 3) O algoritmo kNN é um classificador bastante utilizado em aprendizado de máquina. Seu desempenho e resultado dependem muito do valor k escolhido. Abaixo, você pode observar um diagrama de dispersão, em que existem observações já rotuladas em três classes: “quadrado”, “estrela” e “bola”. O objeto ilustrado com “X” é uma observação não rotulada, na qual deseja-se aplicar o algoritmo kNN com diversos valores de k para poder então classificar esse objeto. Utilize a ideia dos k vizinhos mais próximos para três situações de classificação: 1-NN, 3-NN e 5-NN. Assinale a alternativa que representa corretamente a classificação obtida com cada um dos algoritmos, respectivamente na ordem de 1-NN, 3-NN e 5-NN. Alternativas: Bola, estrela e estrela. CORRETO Bola, estrela e quadrado. Quadrado, estrela e estrela. Bola, bola e estrela. Bola, quadrado e estrela. Resolução comentada: para aplicar o conceito de kNN, é preciso verificar, em cada um dos casos, qual a classe que possui mais vizinhos próximos ao objeto em questão. Com o gráfico abaixo, é possível observar a quantidade de vizinhos completamente dentro dos círculos relativos às redes 1-NN, 3-NN e 5-NN. Para o caso 1-NN, o objeto é classificado como “bola”. Para o caso 3-NN a classificação é “estrela” e para o caso 5-NN, a classificação também é “estrela”. Código da questão: 49614 4) A análise de agrupamentos é utilizada para separar objetos em grupos e, a partir de suas características, identificar objetos similares. Esse tipo de algoritmo pode ser classificado de diversas maneiras, como, por exemplo, métodos hierárquicos, baseados em densidade ou baseados em erro quadrático. Sobre os algoritmos de agrupamento, analise as afirmações a seguir: I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster, depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse processo até o final do algoritmo. II. O agrupamento divisivo e aglomerativo funciona de maneira similar: ambos começam com inúmeros clusters e fundem os grupos de maior similaridade até restar apenas um grande grupo com os objetos. III. O algoritmo k-means utiliza-se de uma etapa de treinamento, em que ele observa os dados de treinamento fornecidos para poder calcular o valor ótimo do parâmetro K, e então poder proceder à etapa de teste. Sendo assim, estão CORRETOS somente os itens: Alternativas: II – III. I. CORRETO II. I – II. I – II – III. Resolução comentada: I. A técnica de clustering hierárquico aglomerativo faz de cada elemento um cluster, depois agrupa os clusters similares, calcula as distâncias entre os clusters e repete esse processo até o final do algoritmo. II. O agrupamento divisivo e aglomerativo funciona de maneira oposta. III. O algoritmo k-means não utiliza etapa de treinamento, e o valor do parâmetro K deve ser passado anteriormente. Código da questão: 49620 5) Técnicas de machine learning podem ser utilizadas para inúmeras finalidades. A seguir, você pode verificar graficamente uma solução que relaciona estilos de escrita e alguns livros famosos: Figura 1 – Ilustração de metodologia de representação gráfica para a relação entre objetos e suas características principais Fonte: adaptada de Gormley (2017). Descrição: esta figura contém uma representação utilizada para relacionar seis obras literárias e seus respectivos estilos. A Figura 1 contém a relação entre obras literárias e suas características; porém, elas estão divididas em duas etapas, sendo que a segunda é uma aproximação da primeira, utilizada para simplificar a análise. Essa aproximação é uma técnica bastante utilizada para a manipulação de dados em sistemas de recomendação. Sendo assim, assinale a alternativa que contém o nome correto da técnica representada pela Figura 1. Alternativas: Recomendação por filtragem colaborativa baseada em métodos de inversão matricial. Recomendação por filtragem baseada em conteúdo com métodos híbridos. Recomendação por filtragem colaborativa baseada em métodos de relações de conteúdos. Recomendação por filtragem colaborativa baseada em métodos de fatoração matricial. CORRETO Recomendação por filtragem colaborativa baseada em métodos de aprendizado profundo. Resolução comentada: a figura contém claramente uma fatoração matricial. A matriz inicial, de dimensão elevada, é manipulada de tal forma a ser fatorada para então poder ser representada pela multiplicação entre as matrizes e . Com isso, a fatoração fica da seguinte forma: Código da questão: 49634 6) Alternativas: Naive Bayes. K vizinhos mais distantes. Regressão multivariável. K vizinhos mais próximos. CORRETO Regressão linear. Resolução comentada: a figura contém um algoritmo de uma técnica kNN, também conhecida como K vizinhos mais próximos. A entrada do algoritmo é o conjunto de treinamento e o valor de k a ser utilizado. A saída é o classificador a ser utilizado. Código da questão: 49612 7) A partir de seus conhecimentos sobre sistemas de recomendação, analise os itens a seguir: ( ) A fatoração matricial é uma forma de trabalhar a matriz de proximidades para poder organizar alfabeticamente os usuários. ( ) Deep learning pode ser utilizado em sistemas de recomendação para criar redes neurais relacionando usuários e objetos. ( ) A principal diferença entre métodos baseados em filtragem colaborativa e métodos baseados em conteúdo é que o primeiroestuda a interação entre usuários e objetos, ao passo que o segundo analisa as suas características. ( ) O método nearest-neighbor, quando aplicado a sistemas de recomendação baseados em filtragem colaborativa, consegue criar matrizes relacionando usuário- usuário, mas não é capaz de gerar matrizes usuário-item. Assinale a alternativa que julga corretamente as afirmações acima como verdadeiras (V) ou falsas (F). Alternativas: V – V – V – F. F – F – V – F.' F – V – V – F. CORRETO V – V – F – F. F – V – V – V. Resolução comentada: ( ) A fatoração matricial é uma forma de trabalhar a matriz de proximidades, mas a organização não é feita por ordem alfabética. ( ) Deep learning pode ser utilizado em sistemas de recomendação para criar redes neurais relacionando usuários e objetos. ( ) A principal diferença entre métodos baseados em filtragem colaborativa e métodos baseados em conteúdo é que o primeiro estuda a interação entre usuários e objetos, ao passo que o segundo analisa as suas características. ( ) O método nearest-neighbor, quando aplicado a sistemas de recomendação baseados em filtragem colaborativa, consegue criar matrizes relacionando usuário- usuário e também é capaz de gerar matrizes usuário-item. Código da questão: 49633 8) Um _____________________ analisa similaridades entre as interações usuário-item, item- item e usuário-usuário. Uma vez que o sistema identifica similaridades, ele consegue fazer recomendações a novos usuários. Geralmente, usuários acessam itens que outros usuários semelhantes gostaram. Assinale a alternativa que preenche corretamente a lacuna do trecho acima. Alternativas: Sistema de conteúdo baseado em recomendação. Sistema de recomendação por filtragem não colaborativa. Sistema de recomendação discriminativo. Sistema de recomendação baseado em conteúdo. Sistema de recomendação por filtragem colaborativa. CORRETO Resolução comentada: O correto é: Um sistema de recomendação por filtragem colaborativa analisa similaridades entre as interações usuário-item, item-item e usuário-usuário. Uma vez que o sistema identifica similaridades, ele consegue fazer recomendações a novos usuários. Geralmente, usuários acessam itens dos quais outros usuários semelhantes gostaram. Código da questão: 49631 9) Uma determinada instituição bancária contratou um programador para desenvolver algoritmos de machine learning para classificar os clientes como “BOM” ou “MAU” de acordo com saldo diário de sua conta durante um ano todo. Os clientes com classificação “BOM” serão convidados para receber um cartão OURO. Para essa tarefa, o programador recebeu apenas um banco de dados com 10.000 clientes já classificados pelos gerentes do banco. O banco de dados contém o saldo diário da conta (365 campos de informação) e a classificação como “BOM” ou “MAU” cliente. Considerando o cenário acima: I. É aconselhável utilizar um algoritmo supervisionado. PORQUE II. Os dados de treinamento fornecidos possuem seus respectivos rótulos e o algoritmo só precisa aprender e gerar uma função capaz de predizer o rótulo correto do cliente. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A primeira asserção está correta e a segunda está incorreta. A primeira asserção está incorreta e a segunda está correta. A primeira e a segunda asserção estão corretas, mas a segunda não justifica a primeira. A primeira e a segunda asserção estão corretas e a segunda justifica a primeira.CORRETO As duas asserções estão incorretas. Resolução comentada: ambas as asserções estão corretas e a segunda justifica a primeira. Código da questão: 49604 10) O Algoritmo Naive Bayes foi criado com sus estrutura baseada no Teorema de Bayes, que diz o seguinte: Considere a seguinte situação: Alternativas: CORRETO Resolução comentada: Código da questão: 49611
Compartilhar