Prévia do material em texto
Prova de Algoritmos e Técnicas de Aprendizado de Máquina: Fundamentos e Aplicações Introdução: Este exame testa o conhecimento sobre os principais algoritmos e técnicas de aprendizado de máquina, incluindo métodos supervisionados e não supervisionados, avaliação de modelos, e otimização. As questões abrangem conceitos teóricos e práticos. Questão 1 Qual é a principal diferença entre os algoritmos de aprendizado supervisionado e não supervisionado? a) O aprendizado supervisionado exige que os dados de treinamento contenham rótulos, enquanto o não supervisionado não. b) O aprendizado supervisionado é mais rápido, pois os dados já são rotulados. c) O aprendizado não supervisionado utiliza rótulos, enquanto o supervisionado não. d) O aprendizado supervisionado é usado apenas em modelos de regressão. e) O aprendizado não supervisionado não pode ser usado para classificação. Questão 2 Em um modelo de regressão logística, qual é a principal função de ativação utilizada? a) Função tangente hiperbólica. b) Função ReLU (Rectified Linear Unit). c) Função sigmoide. d) Função softmax. e) Função linear. Questão 3 O que é a técnica de regularização em aprendizado de máquina? a) Um método para diminuir a precisão de um modelo para evitar overfitting. b) A aplicação de técnicas para balancear os dados de treinamento. c) Um processo para reduzir a complexidade de um modelo e prevenir overfitting. d) A técnica para ajustar os parâmetros de entrada. e) Um algoritmo que escolhe automaticamente os dados de treinamento. Questão 4 No método de K-vizinhos mais próximos (k-NN), qual é o parâmetro crítico para o desempenho do modelo? a) A função de ativação. b) A quantidade de camadas na rede neural. c) O número de vizinhos (k) escolhidos. d) O tipo de kernel utilizado. e) O número de clusters definidos. Questão 5 Em qual cenário o algoritmo de Máquinas de Vetores de Suporte (SVM) seria mais eficaz? a) Quando os dados de entrada são de alta dimensionalidade e precisam de um modelo simples. b) Quando as classes são linearmente separáveis, com um alto nível de ruído nos dados. c) Quando os dados são lineares e o número de características é baixo. d) Quando há pouca diferença entre as classes. e) Quando os dados são altamente correlacionados. Questão 6 Qual é a principal vantagem do algoritmo k-means para agrupamento de dados? a) Ele pode lidar com dados não lineares. b) Ele não precisa especificar o número de clusters a priori. c) Ele é eficiente em termos de computação e fácil de implementar. d) Ele não necessita de inicialização de parâmetros. e) Ele sempre gera resultados ideais para dados grandes. Questão 7 Em redes neurais, qual é o papel da camada de saída? a) Ela recebe a entrada do modelo e aplica uma função de ativação. b) Ela calcula o erro do modelo e ajusta os pesos. c) Ela processa as informações intermediárias antes da saída final. d) Ela produz o resultado final do modelo, com base na soma ponderada das saídas da camada anterior. e) Ela regula a taxa de aprendizado do modelo. Questão 8 O que define o conceito de underfitting em um modelo de aprendizado de máquina? a) Quando o modelo é muito simples e não consegue capturar padrões dos dados. b) Quando o modelo se ajusta de forma excessiva aos dados de treinamento. c) Quando o modelo generaliza bem para novos dados. d) Quando o modelo apresenta um erro de treinamento baixo, mas um erro de validação alto. e) Quando o modelo falha em aprender com os dados de treinamento. Questão 9 Qual é o objetivo da técnica Cross-Validation (validação cruzada)? a) Reduzir o número de variáveis no modelo. b) Testar o desempenho do modelo apenas em dados de teste. c) Validar o modelo em diferentes subconjuntos dos dados para avaliar sua generalização. d) Ajustar os pesos do modelo. e) Melhorar a visualização dos dados de entrada. Questão 10 Em redes neurais profundas, o que caracteriza uma camada convolucional? a) Ela aplica uma operação de convolução nos dados de entrada para extrair características. b) Ela realiza a operação de normalização de todos os dados. c) Ela é responsável por calcular a saída final do modelo. d) Ela reduz a dimensionalidade dos dados. e) Ela ajusta os pesos da rede neural de forma automática. Gabarito e Justificativa 1. a) ○ O aprendizado supervisionado utiliza dados rotulados, enquanto o não supervisionado não. Essa é a principal diferença entre as duas abordagens. 2. c) ○ A regressão logística usa a função sigmoide como função de ativação para prever probabilidades de classes binárias. 3. c) ○ A regularização é uma técnica que adiciona uma penalização à complexidade do modelo, ajudando a prevenir o overfitting, mantendo o modelo simples. 4. c) ○ O parâmetro k, que define o número de vizinhos mais próximos a considerar, é crucial para o desempenho do algoritmo k-NN. 5. b) ○ O SVM é eficaz quando as classes são linearmente separáveis, mesmo com um certo nível de ruído, e funciona bem em problemas de alta dimensionalidade. 6. c) ○ O k-means é simples de implementar e eficiente em termos computacionais, sendo uma escolha popular para agrupamento de dados. 7. d) ○ A camada de saída em redes neurais é responsável por produzir o resultado final do modelo, calculando a saída com base nas entradas e pesos das camadas anteriores. 8. a) ○ O underfitting ocorre quando o modelo é muito simples para capturar os padrões dos dados, resultando em baixo desempenho tanto nos dados de treinamento quanto nos dados de teste. 9. c) ○ A Cross-Validation envolve dividir os dados em vários subconjuntos para testar e treinar o modelo em diferentes partes, o que ajuda a avaliar sua capacidade de generalização. 10. a) ● A camada convolucional aplica uma operação de convolução, geralmente usada para extrair características importantes de imagens ou dados espaciais em redes neurais convolucionais.