Baixe o app para aproveitar ainda mais
Prévia do material em texto
Machine Learning Professor(a): Lucas dos Santos Araujo Claudino (Mestrado acadêmico) 1) 2) 3) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! Analise atentamente a afirmativa a seguir: "Este algoritmo utiliza predições de muitos indivíduos aleatórios, cada uma podendo ter variância diferente, e agrupa todas elas". Assinale a alternativa que representa o algoritmo ao qual a afirmação acima se refere. Alternativas: Árvore de decisão. Rede neural. Support vector machine. K nearest neighbors. Floresta aleatória. CORRETO Código da questão: 49618 O algoritmo kNN possui como característica principal a análise de distância entre objetos. Você observou durante os estudos que o valor do parâmetro k pode influenciar significativamente no desempenho do algoritmo e até mudar o resultado obtido. Assinale a alternativa que define corretamente o que é o parâmetro k em um algoritmo kNN. Alternativas: O parâmetro k representa a quantidade de objetos que o algoritmo consegue processar simultaneamente. É o grau de liberdade computacional do algoritmo a ser implementado. O parâmetro k representa o grau do polinômio criado pelo algoritmo. É o número de pontos existentes no domínio do problema. É o número de vizinhos próximos que são considerados para tomar a decisão sobre a definição da classe do objeto. CORRETO Código da questão: 49610 Existem inúmeros algoritmos de aprendizado de máquina, e cada um é mais indicado para um determinado tipo de dados. Existe um algoritmo que é normalmente sensível quanto à posição das sementes iniciais, o que pode levar para uma convergência local. Esse algoritmo é também sensível a ruídos, dado que ele leva em consideração os desvios dos objetos em relação ao centroide de cada cluster calculado. Por último, esse algoritmo não é indicado para o caso de os clusters possuírem forma não convexa. Assinale a alternativa que contém o nome correto do algoritmo descrito pelo texto acima. Alternativas: Resolução comentada: a floresta aleatória (Random Forest) é o algoritmo que utiliza predições de muitos indivíduos aleatórios, cada uma podendo ter variância diferente, e agrupa todas elas. Resolução comentada: o parâmetro k representa o número de vizinhos próximos que são considerados para tomar a decisão sobre a definição da classe do objeto. 4) 5) Support vector machine. Random Forest. Algoritmo genético. Rede neural. K-means. CORRETO Código da questão: 49624 Existem inúmeras técnicas de agrupamento para serem aplicadas na resolução de problema com machine learning e mineração de dados. Sobre as técnicas de agrupamento não hierárquico, analise as afirmativas a seguir: ( ) A escolha inicial dos objetos a serem utilizados no algoritmo K-means não influencia no resultado final, uma vez que essa técnica é robusta e imune a ótimos locais. ( ) No algoritmo K-médias, cada objeto do domínio pode mudar de cluster K vezes. ( ) Dendogramas são gráficos que mostram como foi a evolução dos clusters formados pelo K-means. Assinale a alternativa que julga corretamente os itens, na sequência: Alternativas: F – F – F. CORRETO V – F – F. F – V – V. V – F – V. V – V – F. Código da questão: 49622 Um _____________________ analisa similaridades entre as interações usuário-item, item-item e usuário-usuário. Uma vez que o sistema identifica similaridades, ele consegue fazer recomendações a novos usuários. Geralmente, usuários acessam itens que outros usuários semelhantes gostaram. Assinale a alternativa que preenche corretamente a lacuna do trecho acima. Alternativas: Sistema de recomendação discriminativo. Sistema de recomendação baseado em conteúdo. Sistema de conteúdo baseado em recomendação. Sistema de recomendação por filtragem não colaborativa. Sistema de recomendação por filtragem colaborativa. CORRETO Resolução comentada: o trecho se refere ao algoritmo K-means. Resolução comentada: a semente inicial influencia bastante no resultado obtido. No K-means, os objetos podem mudar de grupo quantas vezes forem necessárias, até que o critério de parada seja atingido. Dendograma é utilizado para visualizar o processo de clusterização passo a passo, assim como analisar os níveis de distância dos clusters formados. Resolução comentada: O correto é: Um sistema de recomendação por filtragem colaborativa analisa similaridades entre as interações usuário-item, item-item e usuário-usuário. Uma vez que o sistema identifica similaridades, ele consegue fazer recomendações a novos usuários. Geralmente, usuários acessam itens dos quais outros usuários semelhantes gostaram. 6) 7) 8) Código da questão: 49631 João aplicou um teste de múltipla escolha contendo 120 questões para um grande grupo de pessoas, e conseguiu perceber que houve uma grande variação na distribuição das notas. João resolveu, então, utilizar um algoritmo para agrupar os alunos, para que cada aluno pudesse ficar no grupo mais indicado, de acordo com sua nota. Dessa forma, ele poderá elaborar trabalhos específicos para cada grupo. Assinale a alternativa que contém o algoritmo mais indicado para a realização desse agrupamento. Alternativas: Monte Carlo. Regressão logística. K-means. CORRETO Regressão linear. Regressão multivariável. Código da questão: 49623 Uma certa empresa selecionou profissionais para implementar um software de análise de fraudes em sistemas de cartão de crédito. Um dos requisitos para a contratação era que o profissional tivesse conhecimento sobre redes multilayer perceptrons. Nesse contexto, perceptron é: Alternativas: Composto por duas redes simétricas que têm quatro ou cinco camadas rasas que representam a metade da codificação (encoder) da rede. Um algoritmo de rede neural artificial simples dedicado a efetuar uma análise binária para identificar se determinada transação é fraude ou não fraude. CORRETO O método-padrão em redes neurais artificiais para cálculo da contribuição de erro de cada neurônio após processamento de um lote de dados. INCORRETO Um algoritmo de redes neurais artificiais composto de várias camadas ocultas e a função sigmoide como função de saída. Um algoritmo de rede neural artificial simples dedicado a efetuar uma análise de regressão com valores de saída pertencentes ao conjunto dos reais positivos. Código da questão: 49628 Uma determinada instituição bancária contratou um programador para desenvolver algoritmos de machine learning para classificar os clientes como “BOM” ou “MAU” de acordo com saldo diário de sua conta durante um ano todo. Os clientes com classificação “BOM” serão convidados para receber um cartão OURO. Para essa tarefa, o programador recebeu apenas um banco de dados com 10.000 clientes já classificados pelos gerentes do banco. O banco de dados contém o saldo diário da conta (365 campos de informação) e a classificação como “BOM” ou “MAU” cliente. Considerando o cenário acima: I. É aconselhável utilizar um algoritmo supervisionado. PORQUE Resolução comentada: dentre as alternativas, o único algoritmo que faz o agrupamento, ou clustering, é o k-means. Resolução comentada: perceptron é um algoritmo de rede neural artificial simples dedicado a efetuar uma análise binária para identificar se a saída é {-1;1}. 9) 10) II. Os dados de treinamento fornecidos possuem seus respectivos rótulos e o algoritmo só precisa aprender e gerar uma função capaz de predizer o rótulo correto do cliente. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: As duas asserções estão incorretas. A primeira asserção está correta e a segunda está incorreta. A primeira e a segunda asserção estão corretas, mas a segunda não justificaa primeira. A primeira asserção está incorreta e a segunda está correta. A primeira e a segunda asserção estão corretas e a segunda justifica a primeira. CORRETO Código da questão: 49604 A classificação binária é um dos problemas mais utilizados e estudados em aprendizado de máquina. Sobre o AM de classificação binária, analise os itens a seguir: I. O algoritmo de classificação binária estuda um padrão x contido em um domínio X, e estima qual valor uma variável aleatória binária y∈{±1} irá assumir. II. Caso não haja informação completa sobre o conjunto X de observação, o problema é conhecido como estimativa com variáveis desconhecidas. III. Caso o conjunto X observado no treinamento seja de uma fonte diferente do conjunto X' utilizado na estimação, o problema é conhecido como um problema sem covariância. Assinale a alternativa que indica quais afirmações estão corretas. Alternativas: Somente III. I – II – III. Somente I e II. CORRETO Somente II. Somente I e III. Código da questão: 49602 Um projetista resolveu utilizar seus conhecimentos para a criação de um chatbot, que tem como função simular o ser humano em uma conversação escrita. Para isso, ele deverá utilizar o ________________, que é uma técnica de machine learning, e um de seus principais algoritmos é o ________________. Assinale a alternativa que preenche corretamente as lacunas. Alternativas: Mineração de dados; N-gram Mineração de dados; HTML. Processamento em linguagem natural; HTML. Processamento em linguagem formal; Python. Processamento em linguagem natural; N-gram. CORRETO Resolução comentada: ambas as asserções estão corretas e a segunda justifica a primeira. Resolução comentada: as afirmativas I e II estão corretas. O correto para a afirmativa III seria: “Caso o conjunto X observado no treinamento seja de uma fonte diferente do conjunto X' utilizado na estimação, o problema é conhecido como um problema de correção de descolamento por covariância”. Resolução comentada: Código da questão: 49621 um projetista resolveu utilizar seus conhecimentos para a criação de um chatbot, que tem como função simular o ser humano em uma conversação escrita. Para isso, ele deverá utilizar o processamento em linguagem natural, que é uma técnica de machine learning, e um de seus principais algoritmos é o N-gram. Arquivos e Links
Compartilhar