Prévia do material em texto
Prova- 167: Modelos Supervisionados - Técnicas Avançadas Introdução Nesta prova, vamos explorar técnicas avançadas em modelos supervisionados, com ênfase em regularização, otimização e avaliação de desempenho. Questões 1. Qual é a principal função do parâmetro lambda em regularização L2 (Ridge)? a) Controlar o número de atributos no modelo. b) Aumentar o número de exemplos no treinamento. c) Controlar a complexidade do modelo, penalizando coeficientes grandes. d) Ajustar a dimensionalidade do conjunto de dados. e) Regularizar a distância entre os pontos de dados. 2. O que é um kernel no contexto de máquinas de vetores de suporte (SVM)? a) Uma função usada para normalizar os dados. b) Uma função que transforma os dados em um espaço de alta dimensão para facilitar a separação. c) Uma técnica de redução de dimensionalidade. d) Uma função que aplica um algoritmo de clustering nos dados. e) Uma função usada para escalar os dados de entrada. 3. O que é o gradiente descendente estocástico (SGD)? a) Um algoritmo de otimização que ajusta os pesos do modelo com base em uma amostra aleatória dos dados de treinamento. b) Um tipo de rede neural que usa várias amostras para ajustar os pesos. c) Um algoritmo de classificação baseado em distância entre os pontos. d) Um algoritmo de regularização para evitar overfitting. e) Um método de avaliação de desempenho do modelo. 4. O que caracteriza o Random Forest em termos de treinamento? a) Ele utiliza uma única árvore para prever os resultados. b) Ele combina múltiplas árvores de decisão, treinadas em subconjuntos dos dados. c) Ele faz a mediação entre múltiplos modelos lineares. d) Ele realiza técnicas de clustering durante o treinamento. e) Ele ajusta hiperparâmetros automaticamente. 5. O que é o conceito de overfitting em aprendizado supervisionado? a) O modelo é altamente complexo e não generaliza bem para dados novos. b) O modelo tem baixa precisão em dados de treinamento e teste. c) O modelo se ajusta precisamente aos dados de treinamento, mas perde precisão ao ser testado com novos dados. d) O modelo tem alta precisão em dados de teste, mas falha em prever novos exemplos. e) O modelo é simples e não ajusta bem aos dados de treinamento. 6. O que é a regularização L1 (Lasso)? a) Penaliza coeficientes grandes e reduz a dimensionalidade do modelo, fazendo com que muitos coeficientes se tornem zero. b) Ajusta o número de árvores no modelo de Random Forest. c) Controla a complexidade do modelo, mas não afeta os coeficientes. d) Aumenta a precisão do modelo por meio de validação cruzada. e) Penaliza apenas as funções de ativação na rede neural. 7. O que é o objetivo de validação cruzada? a) Ajustar o número de camadas em uma rede neural. b) Melhorar a precisão apenas em dados de teste. c) Avaliar o modelo em diferentes subconjuntos dos dados para melhorar a capacidade de generalização. d) Ajustar o número de atributos no conjunto de dados. e) Treinar o modelo sem dados rotulados. 8. O que é um modelo ensemble? a) Um modelo que utiliza vários modelos para fazer previsões mais robustas. b) Um modelo que utiliza um único tipo de modelo em todos os casos. c) Um modelo que treina um único modelo e ajusta seus hiperparâmetros. d) Um modelo que só usa dados rotulados para treinamento. e) Um modelo que elimina dados irrelevantes. 9. O que significa a técnica de bagging em aprendizado de máquina? a) Ela aumenta a quantidade de dados rotulados no treinamento. b) Ela combina múltiplos modelos fracos para formar um modelo mais forte. c) Ela combina modelos que fazem predições lineares. d) Ela faz regularização para reduzir a complexidade do modelo. e) Ela ajusta o número de camadas no modelo. 10. O que é um SVM (Support Vector Machine)? a) Um modelo linear usado para classificação e regressão, baseado em encontrar um hiperplano que separa as classes. b) Um modelo de clusterização usado para segmentação de dados. c) Um modelo que usa distâncias para prever classes. d) Um tipo de rede neural usada para prever valores contínuos. e) Um modelo usado para redução de dimensionalidade. Gabarito e Justificativas 1. c) O parâmetro lambda em regularização L2 penaliza coeficientes grandes, controlando a complexidade do modelo. 2. b) O kernel transforma os dados em um espaço de alta dimensão para facilitar a separação. 3. a) O gradiente descendente estocástico (SGD) ajusta os pesos com base em amostras aleatórias dos dados. 4. b) Random Forest combina múltiplas árvores de decisão, treinadas em subconjuntos dos dados. 5. c) O overfitting ocorre quando o modelo se ajusta precisamente aos dados de treinamento, mas perde precisão em novos dados. 6. a) A regularização L1 (Lasso) penaliza coeficientes grandes, fazendo com que muitos coeficientes se tornem zero, reduzindo a dimensionalidade. 7. c) A validação cruzada avalia o modelo em diferentes subconjuntos dos dados para melhorar a capacidade de generalização. 8. a) Modelos ensemble utilizam vários modelos para fazer previsões mais robustas. 9. b) A técnica de bagging combina múltiplos modelos fracos para formar um modelo mais forte. 10. a) O SVM é um modelo linear usado para classificação e regressão, baseado na separação das classes.