Prévia do material em texto
Prova 1: Modelos Avançados de Aprendizado Supervisionado e Não Supervisionado Introdução: Esta prova aborda conceitos e técnicas avançadas de aprendizado supervisionado e não supervisionado, incluindo otimização de modelos, redes neurais, e técnicas de ensemble, com foco na aplicação de algoritmos em grandes conjuntos de dados. Questão 1 O que é um modelo de aprendizado supervisionado? a) Um modelo que utiliza dados não rotulados para encontrar padrões ocultos. b) Um modelo que aprende a partir de dados rotulados, utilizando as informações para prever resultados. c) Um modelo que agrupa dados em categorias, sem necessidade de rótulos. d) Um modelo que utiliza múltiplos algoritmos para melhorar a precisão. e) Um modelo que usa redes neurais para resolver problemas de regressão. Questão 2 Qual é a principal vantagem do algoritmo Random Forest? a) Ele é mais simples e rápido em comparação com outros algoritmos de ensemble. b) Ele combina múltiplas árvores de decisão para melhorar a precisão e reduzir o overfitting. c) Ele trabalha melhor com dados não rotulados, como em tarefas de clustering. d) Ele é uma técnica de regularização para modelos de aprendizado profundo. e) Ele tem uma maior taxa de erro em relação a outros algoritmos. Questão 3 Qual é o objetivo da técnica de feature selection em modelos de aprendizado de máquina? a) Eliminar variáveis que não têm impacto no modelo, melhorando a performance e a interpretabilidade. b) Reduzir a quantidade de dados utilizados no treinamento do modelo. c) Expandir o número de características para melhorar a generalização. d) Aumentar a precisão do modelo sem modificar a quantidade de dados. e) Otimizar os parâmetros do modelo durante o treinamento. Questão 4 O que caracteriza o modelo de SVM (Support Vector Machine)? a) Ele separa os dados em classes utilizando um único ponto de decisão. b) Ele tenta encontrar um hiperplano que maximize a margem de separação entre diferentes classes. c) Ele utiliza redes neurais profundas para resolver problemas de classificação. d) Ele agrupa dados em clusters sem usar rótulos. e) Ele calcula a probabilidade de cada observação pertencer a uma classe. Questão 5 No contexto de redes neurais, qual é a função de uma camada de convolução em uma CNN (Convolutional Neural Network)? a) Realizar operações matemáticas complexas para ajustar os parâmetros do modelo. b) Reduzir a dimensionalidade dos dados de entrada. c) Aplicar filtros nos dados de entrada, extraindo características importantes, como bordas e texturas. d) Dividir os dados em grupos e aplicá-los em diferentes redes. e) Substituir a camada de ativação para permitir o aprendizado de padrões simples. Questão 6 O que é a técnica de dropout em redes neurais? a) Uma técnica de regularização que remove aleatoriamente neurônios durante o treinamento para evitar overfitting. b) Um método de otimização que ajusta os parâmetros do modelo em cada iteração. c) Uma forma de adicionar ruído aos dados de treinamento para aumentar a robustez do modelo. d) Uma técnica usada para acelerar o tempo de treinamento das redes neurais profundas. e) Um método de validação cruzada para melhorar a generalização dos modelos. Questão 7 O que é o Gradient Boosting e como ele melhora o desempenho de um modelo? a) Ele ajusta os parâmetros de uma única árvore de decisão para melhorar o desempenho. b) Ele combina várias árvores de decisão de forma sequencial, corrigindo os erros dos modelos anteriores. c) Ele usa apenas uma rede neural profunda para ajustar os pesos e melhorar a acurácia. d) Ele aplica técnicas de regularização em cada modelo para reduzir o overfitting. e) Ele é um algoritmo não supervisionado que agrupa dados de forma mais precisa. Questão 8 Qual a principal função de uma função de perda em aprendizado supervisionado? a) Minimizar a complexidade do modelo durante o treinamento. b) Avaliar a precisão do modelo no conjunto de validação. c) Maximizar a acurácia do modelo nos dados de treinamento. d) Medir a diferença entre as previsões do modelo e os valores reais para otimizar os parâmetros do modelo. e) Aumentar a capacidade de generalização do modelo. Questão 9 O que é a técnica de regularização em aprendizado de máquina? a) Aumento da complexidade do modelo para melhorar sua capacidade de previsão. b) Redução da complexidade do modelo para evitar overfitting e melhorar a generalização. c) Adição de ruído aos dados de treinamento para reduzir o erro de previsão. d) Aumento do número de variáveis no conjunto de dados para melhorar o desempenho. e) Redefinição dos parâmetros do modelo durante o processo de validação cruzada. Questão 10 Em um modelo de aprendizado supervisionado, qual é a principal característica de um classificador K-NN (K-Nearest Neighbors)? a) Ele realiza previsões com base nos dados mais distantes do ponto de decisão. b) Ele usa a média dos valores de K vizinhos mais próximos para classificar novos dados. c) Ele aplica uma rede neural para prever a classe dos dados. d) Ele se baseia em árvores de decisão para realizar previsões. e) Ele agrupa os dados de acordo com a proximidade de suas características sem rótulos. Gabarito e Justificativa 1. b) ○ O aprendizado supervisionado utiliza dados rotulados para treinar um modelo e prever resultados para novos dados. 2. b) ○ O Random Forest combina múltiplas árvores de decisão para melhorar a precisão e reduzir a variância, tornando o modelo mais robusto. 3. a) ○ A técnica de feature selection visa eliminar características irrelevantes ou redundantes para melhorar a eficiência e a interpretabilidade do modelo. 4. b) ○ O SVM busca encontrar o hiperplano que maximiza a margem de separação entre as classes, visando a melhor generalização. 5. c) ○ As camadas de convolução em uma CNN extraem características importantes dos dados de entrada, como bordas e texturas, fundamentais para tarefas de visão computacional. 6. a) ○ O dropout é uma técnica de regularização que remove aleatoriamente neurônios durante o treinamento, ajudando a evitar overfitting. 7. b) ○ O Gradient Boosting combina árvores de decisão de forma sequencial, corrigindo os erros cometidos pelos modelos anteriores, melhorando a acurácia geral. 8. d) ○ A função de perda mede a diferença entre as previsões e os valores reais, orientando o processo de otimização do modelo. 9. b) ○ A regularização reduz a complexidade do modelo para evitar overfitting, tornando o modelo mais simples e capaz de generalizar melhor. 10. b) ● O classificador K-NN classifica os novos dados com base na classe mais comum entre seus K vizinhos mais próximos, calculados por distância.