Prévia do material em texto
1. O que é "Machine Learning" (Aprendizado de Máquina)? a) Um processo que envolve programação manual de algoritmos. b) A habilidade das máquinas de aprender e melhorar seu desempenho com base em dados. c) A tecnologia que permite às máquinas realizar tarefas sem dados. d) A capacidade das máquinas de entender comandos de voz. Resposta correta: b) A habilidade das máquinas de aprender e melhorar seu desempenho com base em dados. Explicação: Machine Learning é uma subárea da Inteligência Artificial em que as máquinas são capazes de aprender e melhorar suas funções com base em dados, sem serem explicitamente programadas para cada tarefa. 2. Qual é a principal diferença entre aprendizado supervisionado e não supervisionado? a) O aprendizado supervisionado usa dados rotulados, enquanto o não supervisionado usa dados não rotulados. b) O aprendizado não supervisionado usa dados rotulados, enquanto o supervisionado usa dados não rotulados. c) O aprendizado supervisionado é mais rápido que o não supervisionado. d) Não há diferença entre eles. Resposta correta: a) O aprendizado supervisionado usa dados rotulados, enquanto o não supervisionado usa dados não rotulados. Explicação: No aprendizado supervisionado, os dados usados para treinar o modelo já contêm a resposta correta (rótulos). No aprendizado não supervisionado, o modelo precisa identificar padrões sem respostas ou rótulos fornecidos. 3. O que são "features" em Machine Learning? a) As etiquetas atribuídas aos dados. b) As variáveis ou características usadas como entrada para o modelo. c) O algoritmo utilizado para treinar o modelo. d) Os resultados ou previsões gerados pelo modelo. Resposta correta: b) As variáveis ou características usadas como entrada para o modelo. Explicação: Em Machine Learning, "features" (ou características) são as variáveis que representam os dados de entrada para o modelo. Por exemplo, em um modelo de previsão de preços de casas, as "features" podem incluir tamanho da casa, número de quartos, localização, etc. 4. O que é "overfitting" (sobreajuste) em Machine Learning? a) Quando o modelo é muito simples para aprender os padrões dos dados. b) Quando o modelo aprende os dados de treinamento tão bem que não generaliza bem para novos dados. c) Quando o modelo não consegue aprender nada com os dados. d) Quando o modelo é muito rápido ao fazer previsões. Resposta correta: b) Quando o modelo aprende os dados de treinamento tão bem que não generaliza bem para novos dados. Explicação: Overfitting ocorre quando o modelo se ajusta excessivamente aos dados de treinamento, capturando até os "ruídos" ou variações irrelevantes. Isso faz com que o modelo tenha um desempenho ruim com novos dados, pois ele não consegue generalizar. 5. O que é "underfitting" (subajuste) em Machine Learning? a) Quando o modelo é muito simples e não aprende os padrões dos dados. b) Quando o modelo é muito complexo e aprende até os ruídos dos dados. c) Quando o modelo é perfeito, sem erros. d) Quando o modelo ignora completamente os dados de treinamento. Resposta correta: a) Quando o modelo é muito simples e não aprende os padrões dos dados. Explicação: Underfitting ocorre quando o modelo é simples demais para capturar os padrões relevantes dos dados. Isso leva a um desempenho ruim tanto nos dados de treinamento quanto nos dados novos, pois o modelo não aprendeu o suficiente. 6. Qual dos seguintes algoritmos é comumente usado para classificação em Machine Learning? a) Regressão Linear b) K-Vizinhos Mais Próximos (K-NN) c) Análise de Componentes Principais (PCA) d) Algoritmo Genético Resposta correta: b) K-Vizinhos Mais Próximos (K-NN) Explicação: O K-Vizinhos Mais Próximos (K-NN) é um algoritmo usado para tarefas de classificação. Ele classifica uma nova instância com base nas classes da maioria dos "vizinhos" mais próximos na base de dados. 7. O que é uma "função de perda" (loss function) em Machine Learning? a) A função que determina a eficiência de um algoritmo. b) A função que calcula a diferença entre a previsão do modelo e o valor real. c) A função que ajusta os parâmetros do modelo durante o treinamento. d) A função que cria os dados de entrada para o modelo. Resposta correta: b) A função que calcula a diferença entre a previsão do modelo e o valor real. Explicação: A função de perda é usada para quantificar o erro entre as previsões feitas pelo modelo e os valores reais. O objetivo do treinamento do modelo é minimizar essa perda, ajustando os parâmetros para melhorar as previsões. 8. Qual é o propósito da validação cruzada (cross-validation) em Machine Learning? a) Para treinar o modelo com dados não rotulados. b) Para avaliar o desempenho do modelo em diferentes subconjuntos de dados. c) Para ajustar a função de perda do modelo. d) Para gerar novos dados para o treinamento. Resposta correta: b) Para avaliar o desempenho do modelo em diferentes subconjuntos de dados. Explicação: A validação cruzada é uma técnica usada para avaliar a capacidade de generalização de um modelo. Ela envolve dividir os dados em múltiplos subconjuntos (ou "folds") e treinar o modelo em diferentes combinações desses subconjuntos, ajudando a evitar overfitting e garantindo que o modelo funcione bem em dados não vistos. 9. O que é "gradiente descendente" (gradient descent)? a) Um algoritmo para prever a saída de um modelo. b) Um método para otimizar a função de perda ajustando os parâmetros do modelo. c) Um algoritmo usado para classificar dados. d) Um tipo de rede neural. Resposta correta: b) Um método para otimizar a função de perda ajustando os parâmetros do modelo. Explicação: O gradiente descendente é um algoritmo de otimização usado para minimizar a função de perda ajustando os parâmetros do modelo na direção do gradiente negativo da função de perda, ou seja, na direção que reduz o erro. 10. Qual é a principal vantagem de usar a "máquina de vetor de suporte" (SVM) em Machine Learning? a) Ela é rápida em grandes volumes de dados. b) Ela é capaz de lidar com dados de alta dimensionalidade e encontrar a melhor fronteira de decisão. c) Ela é mais simples que outros algoritmos. d) Ela é indicada apenas para tarefas de regressão. Resposta correta: b) Ela é capaz de lidar com dados de alta dimensionalidade e encontrar a melhor fronteira de decisão. Explicação: A SVM é eficaz para problemas de classificação e é especialmente poderosa quando os dados têm muitas características (alta dimensionalidade). Ela encontra a melhor "fronteira de decisão" (hiperplano) que separa as classes de dados.