Baixe o app para aproveitar ainda mais
Prévia do material em texto
Machine Learning Professor(a): Stella Marys Dornelas Lamounier (Mestrado acadêmico) 1) 2) 3) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! Existe uma classe de aprendizado de máquina (AM) que busca analisar um conjunto de dados D={(x_i,f(x_i )),i=1,…,n}, sendo f(x_i ) uma função desconhecida, para poder criar uma aproximação f ̂(x_i ) capaz de estimar rótulos para novas entradas. Assinale a alternativa que afirma corretamente qual é essa classe de aprendizado de máquina. Alternativas: AM preditivo. CORRETO AM associativo. AM de agrupamento. AM descritivo. AM julgativo. Código da questão: 49606 Em uma determinada aplicação de aprendizado de máquina, foi necessário criar um algoritmo capaz de examinar as características dos dados inseridos e então atribuir um ou mais rótulos a esses dados. Além disso, o algoritmo era supervisionado. Esse algoritmo pode ser considerado um tipo de aprendizado de máquina de topologia de ________. Assinale a alternativa que preenche corretamente a lacuna presente no texto. Alternativas: Classificação. CORRETO Regressão. Recomendação. Deep learning. Árvore de decisão. Código da questão: 49601 Considere as seguintes afirmativas sobre algoritmos do tipo ensemble: A. Classificadores individuais podem estar "mais certos" sobre uma parte específica do domínio da função. B. Classificadores que estão "mais certos" podem ter seu voto com valor maior. C. Na maioria dos casos, agrupamentos possuem desempenho superior a classificadores individuais. Assinale a alternativa que contém as afirmativas CORRETAS: Alternativas: A – B – C. CORRETO A – C. A – B. B – C Somente A. Resolução comentada: considere o conjunto de pares de dados como D={(x_i,f(x_i )),i=1,…,n}, sendo que f("x" _i ) é uma função desconhecida. O algoritmo de AM preditivo analisa então esse conjunto para criar uma aproximação f ̂ de f. Com essa aproximação, o algoritmo consegue, então, estimar os rótulos para qualquer nova entrada "x" Resolução comentada: preenchendo a lacuna, temos: “Esse algoritmo pode ser considerado um tipo de aprendizado de máquina de topologia de classificação”. 4) 5) Código da questão: 49616 O aprendizado de máquina é uma área muito abrangente, que possui inúmeras técnicas que podem ser utilizadas para resolver problemas, classificar dados e/ou otimizar recursos. Analise as afirmativas a seguir, que tratam de técnicas de AM. ( ) Máquinas de vetor de suporte (SVM – support vector machine) são técnicas de aprendizado de máquina preditivo de otimização que buscam encontrar algum hiperplano em um espaço N-dimensional capaz de fazer a separação ótima entre os dados. ( ) Algoritmos de redes neurais artificiais são sistemas baseados no funcionamento do cérebro humano e executam as tarefas específicas para as quais foram projetados. ( ) Classificadores do tipo Bayes Ingênuo (Naive Bayes) estimam a probabilidade de uma classificação correta e são uma alternativa competitiva para a classificação de textos. ( ) Métodos de AM baseados em procura possuem um espaço de estados, que é o conjunto com os estados possíveis nos quais o problema pode se encontrar. ( ) Um exemplo AM de busca não informada é o algoritmo Greedy Search. Essa técnica tenta expandir o nó mais próximo da solução desejada, utilizando uma função heurística para saber qual é esse nó. Basicamente, a função heurística utilizada estima a distância entre o nó atual e o estado final. Assinale a alternativa que julga corretamente os itens acima como verdadeiro (V) ou falso (F): Alternativas: V – V – V – F – V. V – F – V – V – V. V – F – F – V – V. V – F – V – V – F. CORRETO V – V – V – V – F. Código da questão: 49609 A partir de seus conhecimentos sobre sistemas de recomendação, analise os itens a seguir: ( ) A fatoração matricial é uma forma de trabalhar a matriz de proximidades para poder organizar alfabeticamente os usuários. ( ) Deep learning pode ser utilizado em sistemas de recomendação para criar redes neurais relacionando usuários e objetos. ( ) A principal diferença entre métodos baseados em filtragem colaborativa e métodos baseados em conteúdo é que o primeiro estuda a interação entre usuários e objetos, ao passo que o segundo analisa as suas características. ( ) O método nearest-neighbor, quando aplicado a sistemas de recomendação baseados em filtragem colaborativa, consegue criar matrizes relacionando usuário-usuário, mas não é capaz de gerar matrizes usuário-item. Assinale a alternativa que julga corretamente as afirmações acima como verdadeiras (V) ou falsas (F). Alternativas: V – V – V – F. V – V – F – F. F – V – V – F. CORRETO F – V – V – V. F – F – V – F.' Resolução comentada: todas as afirmativas estão corretas. Resolução comentada: o correto para a segunda afirmativa seria: “Algoritmos de redes neurais artificiais são sistemas baseados no funcionamento do cérebro humano, e são capazes de aprender para executar tarefas sem terem que ser programados para nenhuma tarefa específica”. O correto para a quinta afirmativa seria: “Um exemplo AM de busca informada é o algoritmo Greedy Search. Essa técnica tenta expandir o nó mais próximo da solução desejada, utilizando uma função heurística para saber qual é esse nó. Basicamente, a função heurística utilizada estima a distância entre o nó atual e o estado final”. Resolução comentada: ( ) A fatoração matricial é uma forma de trabalhar a matriz de proximidades, mas a organização não é feita por ordem alfabética. ( ) Deep learning pode ser utilizado em sistemas de recomendação para criar redes neurais relacionando usuários e objetos. ( ) A principal diferença entre métodos baseados em filtragem colaborativa e métodos baseados em conteúdo é que o primeiro estuda 6) 7) Código da questão: 49633 Os algoritmos de deep learning, diferente de outras técnicas de aprendizado de máquina, consegue ter seu desempenho melhorado e aperfeiçoado conforme a quantidade de dados a ser processada aumenta. Sobre as técnicas e aplicações do aprendizado de máquina do tipo deep learning, julgue os itens a seguir: ( ) O deep learning é bastante indicado para a classificação e detecção de objetos em fotografias, pois é capaz de lidar bem com os milhares de pixels contidos em cada imagem. ( ) O deep learning, por ser uma técnica muito complexa e requerer muito cuidado na criação de cada uma das camadas ocultas do algoritmo, não pode ser aplicado em problemas de aprendizado de máquina não supervisionados. ( ) O deep learning não é utilizado para a criação de tradutores automáticos de texto, pois a implementação de tal algoritmo nessa aplicação iria requerer a utilização de um pré-processamento muito intenso na sequência de caracteres, o que acabaria inviabilizando sua utilização. ( ) Em algoritmos de deep learning, cada subcamada transforma seus dados de entrada em uma representação ligeiramente mais abstrata do que esses dados eram antes. Ao final de todas as camadas ocultas, tem-se, então, o dado modelado de maneira altamente abstrata. Assinale a alternativa que contenha a sequência correta: Alternativas: F – F – F – V. F – V – V – F. V – F – F – V. CORRETO V – F – F – F. V – F – V – V. Código da questão: 49627 Um projetista resolveu utilizar seus conhecimentos para a criação de um chatbot, que tem como função simular o ser humano em uma conversação escrita. Para isso, ele deverá utilizar o ________________, que é uma técnica de machine learning, e um de seus principais algoritmos é o ________________. Assinale a alternativa que preenche corretamente as lacunas. Alternativas: Processamento em linguagem natural; HTML. Processamento em linguagem formal; Python. Mineração de dados; N-gram Mineraçãode dados; HTML. Processamento em linguagem natural; N-gram. CORRETO Código da questão: 49621 a interação entre usuários e objetos, ao passo que o segundo analisa as suas características. ( ) O método nearest-neighbor, quando aplicado a sistemas de recomendação baseados em filtragem colaborativa, consegue criar matrizes relacionando usuário-usuário e também é capaz de gerar matrizes usuário-item. Resolução comentada: ( V ) O deep learning é bastante indicado para a classificação e detecção de objetos em fotografias, pois é capaz de lidar bem com os milhares de pixels contidos em cada imagem. ( F ) O deep learning pode ser aplicado em problemas de aprendizado de máquina não supervisionados. ( F ) O deep learning é utilizado para a criação de tradutores automáticos de texto, pois a implementação de tal algoritmo nessa aplicação é performada de tal forma a não necessitar pré-processamento da sequência de caracteres. ( V ) Em algoritmos de deep learning, cada subcamada transforma seus dados de entrada em uma representação ligeiramente mais abstrata do que esses dados eram antes. Ao final de todas as camadas ocultas, tem-se, então, o dado modelado de maneira altamente abstrata. Resolução comentada: um projetista resolveu utilizar seus conhecimentos para a criação de um chatbot, que tem como função simular o ser humano em uma conversação escrita. Para isso, ele deverá utilizar o processamento em linguagem natural, que é uma técnica de machine learning, e um de seus principais algoritmos é o N-gram. 8) 9) 10) Os algoritmos de aprendizado de máquina baseados em distância podem também ser rotulados como algoritmos “preguiçosos”. Assinale a alternativa que afirma corretamente por que esse rótulo pode ser dado aos algoritmos baseados em distância. Alternativas: Pois eles utilizam apenas as probabilidades de os pontos estarem distanciados a objetos pertencentes à classe deles, e não a real distância entre o objeto a ser analisado e qualquer outro ponto pertencente ao dataset. Eles são preguiçosos pois não passam por uma etapa de treinamento. Pois eles criam um modelo baseados nos dados do treinamento, memorizando os dados e criando uma função matemática que relaciona entradas e saídas fornecidas ao algoritmo. Pois eles analisam poucos dados para então fornecer a resposta. Pois não aprendem ou criam um modelo baseados nos dados do treinamento, eles apenas memorizam os dados e criam um plano n- dimensional para possibilitar a análise das distâncias. CORRETO Código da questão: 49605 Um _____________________ analisa similaridades entre as interações usuário-item, item-item e usuário-usuário. Uma vez que o sistema identifica similaridades, ele consegue fazer recomendações a novos usuários. Geralmente, usuários acessam itens que outros usuários semelhantes gostaram. Assinale a alternativa que preenche corretamente a lacuna do trecho acima. Alternativas: Sistema de recomendação por filtragem não colaborativa. Sistema de recomendação baseado em conteúdo. Sistema de recomendação por filtragem colaborativa. CORRETO Sistema de recomendação discriminativo. Sistema de conteúdo baseado em recomendação. Código da questão: 49631 Existem inúmeros problemas em que você pode aplicar algoritmos de aprendizado de máquina. Sobre os problemas clássicos de aprendizado de máquina, analise as afirmativas a seguir: ( ) A classificação multiclasse pode ser entendida como a extensão da classificação binária. ( ) Algoritmos de regressão não precisam utilizar a etapa de treinamento para criar modelos que relacionam as características dos dados. ( ) O clustering é uma tarefa do aprendizado de máquina supervisionado e tem como objetivo agrupar os dados disponíveis em grupos com características semelhantes. Classifique as afirmações como verdadeiro (V) e falso (F) e assinale a alternativa que contenha a sequência correta, respectivamente, de cima para baixo. Alternativas: V – V – V. F – V – F. V – F – F. CORRETO V – V – F. V – F – V. Resolução comentada: esses algoritmos são rotulados como “preguiçosos” (lazy) pois não aprendem ou criam um modelo baseados nos dados do treinamento, eles apenas memorizam os dados e criam um plano n-dimensional para possibilitar a análise das distâncias. Resolução comentada: O correto é: Um sistema de recomendação por filtragem colaborativa analisa similaridades entre as interações usuário-item, item-item e usuário- usuário. Uma vez que o sistema identifica similaridades, ele consegue fazer recomendações a novos usuários. Geralmente, usuários acessam itens dos quais outros usuários semelhantes gostaram. Resolução comentada: Código da questão: 49603 o clustering é uma tarefa do aprendizado de máquina não supervisionado e tem como objetivo agrupar os dados disponíveis em grupos com características semelhantes. Arquivos e Links
Compartilhar