Prévia do material em texto
Prova- 164: Modelos Supervisionados: Conceitos e Aplicações Introdução Nesta prova, você será desafiado a explorar os conceitos e aplicações de modelos supervisionados em problemas práticos, incluindo análise de métricas de desempenho e técnicas de otimização. Questões 1. Qual das alternativas a seguir descreve um modelo supervisionado? a) Um modelo que lida apenas com dados não rotulados. b) Um modelo que é treinado usando dados rotulados para fazer previsões ou classificações. c) Um modelo que não precisa de dados para treinamento. d) Um modelo que ajusta a média de um conjunto de dados. e) Um modelo usado para clusterização de dados. 2. O que é a métrica de precisão em problemas de classificação? a) A proporção de previsões erradas feitas pelo modelo. b) A proporção de verdadeiros positivos em relação a todas as previsões feitas pelo modelo. c) A capacidade de generalização do modelo. d) A medida de complexidade do modelo. e) A medida da dimensionalidade do conjunto de dados. 3. O que é o SVM (Support Vector Machine)? a) Um algoritmo de clusterização baseado em distâncias. b) Um algoritmo de classificação que encontra o melhor hiperplano separador entre as classes. c) Um modelo que ajusta uma curva para prever valores contínuos. d) Um algoritmo de rede neural para prever a classe. e) Um algoritmo de regressão linear. 4. O que é bagging e como ele funciona em modelos de aprendizado supervisionado? a) Uma técnica que combina múltiplos algoritmos independentes para melhorar a precisão. b) Uma técnica de redução de dimensionalidade. c) Uma técnica que utiliza uma única árvore de decisão para fazer previsões. d) Uma técnica que cria subconjuntos de dados e treina modelos em cada um deles. e) Uma técnica para aumentar o número de atributos do modelo. 5. O que são hiperparâmetros? a) Parâmetros ajustados automaticamente durante o treinamento do modelo. b) Parâmetros ajustados manual pelo usuário para controlar o comportamento do modelo. c) Parâmetros que definem a quantidade de dados rotulados utilizados no treinamento. d) Parâmetros que aumentam a complexidade do modelo. e) Parâmetros que ajustam a dimensionalidade do conjunto de dados. 6. Como o k-fold cross-validation ajuda na avaliação de um modelo? a) Ele aumenta a quantidade de dados rotulados utilizados no treinamento. b) Ele divide o conjunto de dados em várias partes e testa o modelo em cada uma delas. c) Ele ajusta automaticamente os parâmetros do modelo. d) Ele avalia o modelo com base em um único conjunto de dados de treinamento. e) Ele melhora a generalização do modelo. 7. O que caracteriza o algoritmo Naive Bayes? a) Ele assume que as variáveis de entrada são dependentes entre si. b) Ele assume que as variáveis de entrada são independentes entre si. c) Ele usa redes neurais para a classificação. d) Ele utiliza uma função de ativação para prever classes. e) Ele é usado apenas em problemas de regressão. 8. Qual é o objetivo da regularização em modelos supervisionados? a) Aumentar a complexidade do modelo. b) Evitar o overfitting, controlando a complexidade do modelo. c) Ajustar o número de atributos no modelo. d) Diminuir a quantidade de dados rotulados necessários para treinamento. e) Melhorar a precisão do modelo ao adicionar mais dados. 9. Qual técnica é utilizada para redução de dimensionalidade? a) PCA (Principal Component Analysis). b) Naive Bayes. c) SVM. d) K-means clustering. e) Bagging. 10. O que é uma matriz de confusão? a) Um algoritmo que calcula a precisão do modelo. b) Uma técnica para dividir os dados em conjuntos de treinamento e teste. c) Um resumo das previsões feitas pelo modelo comparadas aos valores reais. d) Uma ferramenta para medir a dimensionalidade dos dados. e) Uma técnica para eliminar variáveis irrelevantes. Gabarito e Justificativas 1. b) A classificação supervisionada é treinada com dados rotulados. 2. b) A precisão é a proporção de verdadeiros positivos em relação a todas as previsões feitas. 3. b) O SVM é um algoritmo de classificação que encontra o melhor hiperplano separador entre as classes. 4. d) Bagging cria subconjuntos de dados e treina modelos em cada um deles, melhorando a robustez. 5. b) Hiperparâmetros são ajustados manual pelo usuário para controlar o comportamento do modelo. 6. b) k-fold cross-validation divide os dados em várias partes e testa o modelo em cada uma delas. 7. b) Naive Bayes assume que as variáveis de entrada são independentes entre si. 8. b) A regularização controla a complexidade do modelo para evitar overfitting. 9. a) PCA (Principal Component Analysis) é utilizado para redução de dimensionalidade. 10. c) A matriz de confusão compara as previsões feitas com os valores reais para avaliar o desempenho do modelo.