Prévia do material em texto
Prova- 121: Modelos Supervisionados e Aplicações em Análise Preditiva Introdução Esta prova aborda modelos supervisionados, com foco nas estratégias de análise preditiva e como os diferentes algoritmos de aprendizado podem ser aplicados para a análise de dados e previsão de resultados. Questões 1. O que caracteriza o modelo SVM (Support Vector Machine)? a) Utiliza um modelo de regressão linear para prever variáveis contínuas. b) Funciona apenas em problemas de classificação multiclasse. c) Procura encontrar a melhor linha de separação entre diferentes classes, maximizando a margem. d) Baseia-se em redes neurais profundas para prever a classe. e) Não pode ser usado para dados não rotulados. 2. O que é a técnica de validação cruzada? a) Uma técnica que divide os dados em duas partes, uma para treinamento e outra para teste. b) Uma técnica para avaliar a acurácia de um modelo dividindo os dados em múltiplas partes e validando em cada uma delas. c) Um método para regularizar os dados de entrada. d) Um algoritmo de otimização que ajusta a complexidade do modelo. e) Uma técnica de redução de dimensionalidade. 3. Qual a diferença entre classificação e regressão? a) Classificação é usada para prever variáveis contínuas, enquanto regressão é usada para prever classes. b) Classificação envolve a previsão de categorias ou rótulos, enquanto regressão prevê valores numéricos contínuos. c) Classificação envolve agrupamento de dados, enquanto regressão apenas faz previsões. d) Não há diferença; ambos os métodos são utilizados para prever valores contínuos. e) Classificação é um método supervisionado, enquanto regressão é não supervisionado. 4. O que é o conceito de regularização em modelos de aprendizado supervisionado? a) Aumento do número de variáveis de entrada. b) Ajuste da estrutura do modelo para torná-lo mais complexo. c) Técnica para evitar o overfitting ao penalizar modelos complexos. d) Ajuste de hiperparâmetros para otimizar a acurácia do modelo. e) Técnica para aumentar a acurácia em dados de teste. 5. Qual o objetivo principal do algoritmo K-means? a) Classificar dados com base em uma rede neural profunda. b) Agrupar dados em k clusters baseados na similaridade. c) Prever variáveis contínuas. d) Calcular a probabilidade de ocorrência de cada classe. e) Ajustar os pesos de um modelo de regressão. 6. Como o modelo Naive Bayes realiza classificações? a) Ele assume que as variáveis de entrada são independentes e calcula probabilidades para cada classe. b) Ele utiliza redes neurais profundas para aprender a estrutura dos dados. c) Ele combina múltiplos classificadores para gerar uma previsão. d) Ele agrupa dados de forma hierárquica para fazer previsões. e) Ele ajusta iterativamente os pesos dos dados de entrada. 7. O que é overfitting em aprendizado supervisionado? a) Quando o modelo não consegue aprender com os dados de treinamento. b) Quando o modelo tem bom desempenho em dados de treinamento, mas falha em generalizar para dados novos. c) Quando o modelo é simples demais e não consegue capturar os padrões dos dados. d) Quando o modelo não está ajustado para as variáveis de entrada. e) Quando o modelo tem uma alta acurácia nas previsões. 8. Qual é o papel da função de custo em algoritmos supervisionados? a) Ela define o número de camadas de uma rede neural. b) Ela mede a precisão do modelo. c) Ela avalia a diferença entre as previsões do modelo e os valores reais, ajudando a otimizar os parâmetros. d) Ela ajusta os pesos das variáveis de entrada. e) Ela controla a complexidade do modelo, ajustando os hiperparâmetros. 9. O que caracteriza o método Random Forest? a) Ele usa múltiplas árvores de decisão para classificar os dados. b) Ele usa apenas uma árvore de decisão com diferentes profundidades. c) Ele combina várias redes neurais para melhorar a previsão. d) Ele agrupa dados de forma hierárquica para melhorar a precisão. e) Ele é utilizado para reduzir a dimensionalidade dos dados. 10. O que significa o termo bagging? a) A combinação de múltiplos modelos fracos para melhorar a precisão e reduzir a variância. b) A técnica de agrupar dados para formar clusters. c) A técnica de ajustar hiperparâmetros para otimizar o modelo. d) A técnica de regularização para evitar overfitting. e) A técnica de reduzir a quantidade de dados no treinamento. Gabarito e Justificativas 1. c) O modelo SVM encontra a melhor linha de separação entre classes, maximizando a margem entre elas. 2. b) A validação cruzada divide os dados em várias partes e valida o modelo em cada uma delas para uma avaliação mais robusta. 3. b) Classificação é usada para prever categorias, enquanto regressão é usada para prever valores contínuos. 4. c) A regularização penaliza modelos complexos para evitar o overfitting, melhorando a generalização. 5. b) O K-means é um algoritmo de agrupamento que divide os dados em k clusters com base na similaridade. 6. a) O Naive Bayes assume que as variáveis de entrada são independentes e calcula probabilidades para cada classe. 7. b) Overfitting ocorre quando o modelo tem bom desempenho nos dados de treinamento, mas não generaliza bem para novos dados. 8. c) A função de custo mede a diferença entre as previsões e os valores reais, permitindo a otimização do modelo. 9. a) O Random Forest usa várias árvores de decisão para melhorar a precisão da previsão e reduzir a variância. 10. a) O bagging combina múltiplos modelos fracos (geralmente árvores de decisão) para melhorar a precisão e reduzir a variância.