Prévia do material em texto
Prova- 109: Aplicações de Algoritmos de Machine Learning Introdução Esta prova explora a aplicação de algoritmos de aprendizado de máquina em diferentes cenários e suas abordagens práticas. O foco está na análise de técnicas de classificação, regressão e técnicas avançadas de modelagem. Questões 1. O que significa Overfitting em modelos de machine learning? a) Quando o modelo aprende até os detalhes irrelevantes dos dados de treinamento, prejudicando sua capacidade de generalizar para novos dados. b) Quando o modelo é incapaz de aprender a partir dos dados de treinamento. c) Quando o modelo é simplificado e perde a capacidade de identificar padrões. d) Quando o modelo tem uma baixa taxa de erro em dados de teste, mas alta em dados de treinamento. e) Quando o modelo consegue generalizar perfeitamente para todos os dados. 2. Qual é a função principal do algoritmo Random Forest? a) Agrupar dados com base em características semelhantes sem rótulos. b) Construir várias árvores de decisão e combinar suas previsões para melhorar a precisão. c) Reduzir a dimensionalidade de grandes volumes de dados. d) Prever valores contínuos com base em variáveis independentes. e) Ajustar a regularização para evitar o overfitting em modelos. 3. Qual é a principal vantagem de usar a técnica Principal Component Analysis (PCA)? a) Reduzir a dimensionalidade dos dados, mantendo a maior parte da variabilidade dos dados originais. b) Melhorar a precisão do modelo sem modificar os dados. c) Permitir a visualização de dados em 3D. d) Prever os valores de uma variável dependente com base em várias variáveis independentes. e) Agrupar dados em clusters com base em características comuns. 4. O que é o algoritmo K-NN (K-Nearest Neighbors)? a) Um algoritmo de aprendizado supervisionado que prevê uma classe para novos dados com base nas classes de seus vizinhos mais próximos. b) Um modelo de regressão utilizado para prever a probabilidade de um evento. c) Um algoritmo de clustering utilizado para agrupar dados em clusters com características semelhantes. d) Um método para ajustar os parâmetros do modelo de aprendizado profundo. e) Um algoritmo de redes neurais utilizado para prever séries temporais. 5. Qual a principal característica de um modelo de Aprendizado Não Supervisionado? a) O modelo é treinado com dados rotulados, ou seja, com respostas já conhecidas. b) O modelo aprende a partir de dados sem rótulos, buscando identificar padrões ou estruturas subjacentes nos dados. c) O modelo utiliza algoritmos de redes neurais para prever eventos. d) O modelo é sempre mais eficaz em tarefas de classificação do que o aprendizado supervisionado. e) O modelo é usado para prever séries temporais. 6. O que é um algoritmo de árvore de decisão? a) Um modelo que faz previsões baseadas em uma série de perguntas "sim/não", dividindo os dados em ramos. b) Um modelo linear que ajusta os dados com base em uma equação matemática. c) Um algoritmo de clustering utilizado para agrupar dados. d) Um modelo de aprendizado não supervisionado utilizado para encontrar padrões em grandes conjuntos de dados. e) Um modelo para prever probabilidades de eventos futuros. 7. O que caracteriza um modelo de aprendizado supervisionado? a) O modelo é treinado com dados rotulados, ou seja, com as respostas já conhecidas. b) O modelo é treinado sem dados rotulados e busca encontrar padrões nos dados. c) O modelo é usado para fazer previsões sem supervisão de dados. d) O modelo ajusta os parâmetros de acordo com a variabilidade dos dados. e) O modelo é utilizado para prever séries temporais. 8. Qual é o papel da função de perda (loss function) em modelos de machine learning? a) Avaliar o desempenho do modelo e fornecer feedback para melhorar sua precisão durante o treinamento. b) Melhorar a precisão do modelo ao adicionar mais variáveis. c) Ajustar os parâmetros do modelo para reduzir a dimensionalidade dos dados. d) Selecionar o melhor conjunto de variáveis para o modelo. e) Dividir os dados em conjuntos de treinamento e teste. 9. O que é a técnica de Regularização em modelos de aprendizado de máquina? a) A adição de penalidades aos coeficientes do modelo para evitar que o modelo seja excessivamente complexo e se ajuste aos ruídos dos dados de treinamento. b) A redução do número de variáveis em um modelo, eliminando as irrelevantes. c) A técnica de dividir os dados em subconjuntos para melhorar a performance. d) O uso de diferentes algoritmos de aprendizado para ajustar os parâmetros do modelo. e) A adição de novos dados ao conjunto de treinamento para melhorar a previsão. 10. O que caracteriza um modelo de regressão? a) Prever o valor de uma variável dependente contínua com base em uma ou mais variáveis independentes. b) Classificar dados em categorias distintas. c) Agrupar dados com base em características comuns. d) Estimar a probabilidade de ocorrência de um evento. e) Realizar clustering de dados com base em suas características. Gabarito e Justificativas 1. a) Overfitting ocorre quando o modelo aprende até os detalhes irrelevantes dos dados de treinamento, o que prejudica a generalização. 2. b) O Random Forest combina várias árvores de decisão para melhorar a precisão e evitar o overfitting. 3. a) PCA é utilizado para reduzir a dimensionalidade dos dados enquanto mantém a maior parte da variabilidade original. 4. a) O K-NN classifica novos dados com base nos vizinhos mais próximos no conjunto de treinamento. 5. b) Modelos de aprendizado não supervisionado aprendem a partir de dados sem rótulos, identificando padrões subjacentes. 6. a) O algoritmo de árvore de decisão faz previsões com base em perguntas "sim/não" e divide os dados em ramos. 7. a) Modelos supervisionados são treinados com dados rotulados, ou seja, com as respostas já conhecidas. 8. a) A função de perda avalia o desempenho do modelo e orienta o treinamento para melhorar a precisão. 9. a) A regularização adiciona penalidades aos coeficientes do modelo para evitar overfitting e simplificar o modelo. 10. a) Modelos de regressão são usados para prever uma variável dependente contínua com base em variáveis independentes.