Prova de Ciência de Dados_ Fundamentos e Aplicações de Machine Learning

Outros

Carme Timoteo

em 11/02/2025

Questões resolvidas

Qual das seguintes afirmacoes descreve corretamente o conceito de overfitting?
a) O modelo não é capaz de aprender com os dados de treinamento.
b) O modelo se ajusta excessivamente aos dados de treinamento, o que afeta a capacidade de generalizar.
c) O modelo não consegue prever nada fora do conjunto de validação.
d) O modelo funciona bem tanto nos dados de treinamento quanto nos de validação.
e) O modelo ignora as variáveis mais importantes do conjunto de dados.

O que é cross-validation em aprendizado de máquina?
a) A validação do modelo apenas em dados de teste.
b) A técnica de divisão dos dados de treinamento em várias partes para avaliar a performance do modelo.
c) O ajuste de parâmetros para melhorar a performance em dados de treinamento.
d) A avaliação do modelo apenas com dados rotulados.
e) A redução da complexidade do modelo para evitar overfitting.

Qual algoritmo é tipicamente utilizado para problemas de classificação binária?
a) Regressão Linear
b) Árvore de Decisão
c) K-Means
d) Regressão Logística
e) Redes Neurais Convolucionais

Em aprendizado supervisionado, como é definido o modelo de regressão?
a) O modelo prevê valores discretos a partir de variáveis contínuas.
b) O modelo não faz previsões, apenas agrupa os dados.
c) O modelo prevê valores contínuos com base em variáveis independentes.
d) O modelo não precisa de dados rotulados para aprender.
e) O modelo classifica os dados em diferentes grupos ou classes.

Qual técnica de redução de dimensionalidade é comumente usada para reduzir a complexidade dos dados e melhorar o desempenho de modelos de aprendizado de máquina?
a) Regressão Logística
b) Análise de Componentes Principais (PCA)
c) Redes Neurais
d) Algoritmo K-Nearest Neighbors
e) Regressão Linear

Em um modelo de aprendizado supervisionado, qual é o papel da variável dependente?
a) Determinar o número de parâmetros do modelo.
b) Representar a entrada para o modelo.
c) Servir como a variável que o modelo está tentando prever.
d) Ajudar a ajustar os hiperparâmetros do modelo.
e) Determinar a complexidade do modelo.

O que é o algoritmo de otimização no contexto de aprendizado de máquina?
a) Um algoritmo que ajuda a reduzir o tempo de treinamento de um modelo.
b) Um algoritmo que ajusta os parâmetros do modelo para minimizar a função de custo.
c) Um algoritmo que classifica os dados em diferentes categorias.
d) Um algoritmo utilizado para aumentar a quantidade de dados disponíveis.
e) Um algoritmo que calcula a acurácia do modelo.

Qual técnica de aprendizado de máquina é usada para agrupar dados não rotulados em grupos com base em características semelhantes?
a) Regressão Linear
b) K-Nearest Neighbors
c) K-Means Clustering
d) Árvore de Decisão
e) Regressão Logística

Em redes neurais, o que é uma camada convolucional?
a) Uma camada responsável pela classificação dos dados.
b) Uma camada que agrupa os dados de entrada em diferentes classes.
c) Uma camada que aplica um filtro para extrair características locais dos dados.
d) Uma camada que calcula a saída final do modelo.
e) Uma camada que realiza a redução de dimensionalidade dos dados.

Em que tipo de problema o algoritmo K-Nearest Neighbors (K-NN) é mais indicado?
a) Problemas de classificação com grandes conjuntos de dados rotulados.
b) Problemas de regressão com dados temporais.
c) Problemas de agrupamento de dados com variáveis contínuas.
d) Problemas de classificação e regressão baseados na proximidade entre os dados.
e) Problemas de classificação binária apenas.

Conteúdos escolhidos para você

4 pág.

Prova de Ciência de Dados_ Algoritmos e Técnicas de Aprendizado Supervisionado e Não Supervisionado

4 pág.

Métodos Avançados de Estatística e Machine Learning

Perguntas dessa disciplina

Pergunta 1 Qual é a principal característica do aprendizado não supervisionado? a. Aprende a partir de dados sem rótulos. b. Utiliza dados rotulados.

UNIP

Uma empresa de e-commerce coletou dados de comportamento de compra de seus clientes durante os últimos três anos, incluindo informações demográfica...

Anhanguera

Associe cada etapa da construção de um modelo de regressão linear múltipla com sua descrição correta, considerando a importância de cada uma para gara

UNICID

Pergunta 1. Os Sistemas de Informação Geográfica (SIG) permitem a integração e análise de diferentes tipos de dados geoespaciais organizados em camada

FACAP

A aplicação de Machine Learning (ML) em IoT tem como objetivo prever eventos com base em padrões históricos de dados sensoriais. Entre os algoritmo...

Uniasselvi

Material

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Qual das seguintes afirmacoes descreve corretamente o conceito de overfitting?
a) O modelo não é capaz de aprender com os dados de treinamento.
b) O modelo se ajusta excessivamente aos dados de treinamento, o que afeta a capacidade de generalizar.
c) O modelo não consegue prever nada fora do conjunto de validação.
d) O modelo funciona bem tanto nos dados de treinamento quanto nos de validação.
e) O modelo ignora as variáveis mais importantes do conjunto de dados.

O que é cross-validation em aprendizado de máquina?
a) A validação do modelo apenas em dados de teste.
b) A técnica de divisão dos dados de treinamento em várias partes para avaliar a performance do modelo.
c) O ajuste de parâmetros para melhorar a performance em dados de treinamento.
d) A avaliação do modelo apenas com dados rotulados.
e) A redução da complexidade do modelo para evitar overfitting.

Qual algoritmo é tipicamente utilizado para problemas de classificação binária?
a) Regressão Linear
b) Árvore de Decisão
c) K-Means
d) Regressão Logística
e) Redes Neurais Convolucionais

Em aprendizado supervisionado, como é definido o modelo de regressão?
a) O modelo prevê valores discretos a partir de variáveis contínuas.
b) O modelo não faz previsões, apenas agrupa os dados.
c) O modelo prevê valores contínuos com base em variáveis independentes.
d) O modelo não precisa de dados rotulados para aprender.
e) O modelo classifica os dados em diferentes grupos ou classes.

Qual técnica de redução de dimensionalidade é comumente usada para reduzir a complexidade dos dados e melhorar o desempenho de modelos de aprendizado de máquina?
a) Regressão Logística
b) Análise de Componentes Principais (PCA)
c) Redes Neurais
d) Algoritmo K-Nearest Neighbors
e) Regressão Linear

Em um modelo de aprendizado supervisionado, qual é o papel da variável dependente?
a) Determinar o número de parâmetros do modelo.
b) Representar a entrada para o modelo.
c) Servir como a variável que o modelo está tentando prever.
d) Ajudar a ajustar os hiperparâmetros do modelo.
e) Determinar a complexidade do modelo.

O que é o algoritmo de otimização no contexto de aprendizado de máquina?
a) Um algoritmo que ajuda a reduzir o tempo de treinamento de um modelo.
b) Um algoritmo que ajusta os parâmetros do modelo para minimizar a função de custo.
c) Um algoritmo que classifica os dados em diferentes categorias.
d) Um algoritmo utilizado para aumentar a quantidade de dados disponíveis.
e) Um algoritmo que calcula a acurácia do modelo.

Qual técnica de aprendizado de máquina é usada para agrupar dados não rotulados em grupos com base em características semelhantes?
a) Regressão Linear
b) K-Nearest Neighbors
c) K-Means Clustering
d) Árvore de Decisão
e) Regressão Logística

Em redes neurais, o que é uma camada convolucional?
a) Uma camada responsável pela classificação dos dados.
b) Uma camada que agrupa os dados de entrada em diferentes classes.
c) Uma camada que aplica um filtro para extrair características locais dos dados.
d) Uma camada que calcula a saída final do modelo.
e) Uma camada que realiza a redução de dimensionalidade dos dados.

Em que tipo de problema o algoritmo K-Nearest Neighbors (K-NN) é mais indicado?
a) Problemas de classificação com grandes conjuntos de dados rotulados.
b) Problemas de regressão com dados temporais.
c) Problemas de agrupamento de dados com variáveis contínuas.
d) Problemas de classificação e regressão baseados na proximidade entre os dados.
e) Problemas de classificação binária apenas.

Conteúdos escolhidos para você

4 pág.

Prova de Ciência de Dados_ Algoritmos e Técnicas de Aprendizado Supervisionado e Não Supervisionado

4 pág.

Prova de Ciência de Dados_ Algoritmos de Machine Learning e Suas Aplicações

3 pág.

Métodos de Análise de Dados e Avaliação de Modelos Estatísticos

3 pág.

Fundamentos de Machine Learning e Modelagem Preditiva(1)

3 pág.

Métodos Avançados de Estatística e Machine Learning

Perguntas dessa disciplina

Pergunta 1 Qual é a principal característica do aprendizado não supervisionado? a. Aprende a partir de dados sem rótulos. b. Utiliza dados rotulados.

UNIP

Uma empresa de e-commerce coletou dados de comportamento de compra de seus clientes durante os últimos três anos, incluindo informações demográfica...

Anhanguera

Associe cada etapa da construção de um modelo de regressão linear múltipla com sua descrição correta, considerando a importância de cada uma para gara

UNICID

Pergunta 1. Os Sistemas de Informação Geográfica (SIG) permitem a integração e análise de diferentes tipos de dados geoespaciais organizados em camada

FACAP

A aplicação de Machine Learning (ML) em IoT tem como objetivo prever eventos com base em padrões históricos de dados sensoriais. Entre os algoritmo...

Uniasselvi

Prévia do material em texto

Prova de Ciência de Dados: Fundamentos e Aplicações de Machine
Learning
Introdução:
Nesta prova, abordaremos os fundamentos e as aplicações de machine learning,
explorando técnicas e algoritmos que são essenciais para o desenvolvimento de modelos
preditivos e analíticos. A prova foca em conceitos chave, como aprendizado supervisionado
e não supervisionado, regularização, avaliação de modelos e o uso de diferentes algoritmos
para resolver problemas complexos com dados. O objetivo é avaliar a capacidade do aluno
de compreender e aplicar essas técnicas.
Questão 1
Qual das seguintes afirmações descreve corretamente o conceito de overfitting?
a) O modelo não é capaz de aprender com os dados de treinamento.
b) O modelo se ajusta excessivamente aos dados de treinamento, o que afeta a capacidade
de generalizar.
c) O modelo não consegue prever nada fora do conjunto de validação.
d) O modelo funciona bem tanto nos dados de treinamento quanto nos de validação.
e) O modelo ignora as variáveis mais importantes do conjunto de dados.
Questão 2
O que é cross-validation em aprendizado de máquina?
a) A validação do modelo apenas em dados de teste.
b) A técnica de divisão dos dados de treinamento em várias partes para avaliar a
performance do modelo.
c) O ajuste de parâmetros para melhorar a performance em dados de treinamento.
d) A avaliação do modelo apenas com dados rotulados.
e) A redução da complexidade do modelo para evitar overfitting.
Questão 3
Qual algoritmo é tipicamente utilizado para problemas de classificação binária?
a) Regressão Linear
b) Árvore de Decisão
c) K-Means
d) Regressão Logística
e) Redes Neurais Convolucionais
Questão 4
Em aprendizado supervisionado, como é definido o modelo de regressão?
a) O modelo prevê valores discretos a partir de variáveis contínuas.
b) O modelo não faz previsões, apenas agrupa os dados.
c) O modelo prevê valores contínuos com base em variáveis independentes.
d) O modelo não precisa de dados rotulados para aprender.
e) O modelo classifica os dados em diferentes grupos ou classes.
Questão 5
Qual técnica de redução de dimensionalidade é comumente usada para reduzir a
complexidade dos dados e melhorar o desempenho de modelos de aprendizado de
máquina?
a) Regressão Logística
b) Análise de Componentes Principais (PCA)
c) Redes Neurais
d) Algoritmo K-Nearest Neighbors
e) Regressão Linear
Questão 6
Em um modelo de aprendizado supervisionado, qual é o papel da variável dependente?
a) Determinar o número de parâmetros do modelo.
b) Representar a entrada para o modelo.
c) Servir como a variável que o modelo está tentando prever.
d) Ajudar a ajustar os hiperparâmetros do modelo.
e) Determinar a complexidade do modelo.
Questão 7
O que é o algoritmo de otimização no contexto de aprendizado de máquina?
a) Um algoritmo que ajuda a reduzir o tempo de treinamento de um modelo.
b) Um algoritmo que ajusta os parâmetros do modelo para minimizar a função de custo.
c) Um algoritmo que classifica os dados em diferentes categorias.
d) Um algoritmo utilizado para aumentar a quantidade de dados disponíveis.
e) Um algoritmo que calcula a acurácia do modelo.
Questão 8
Qual técnica de aprendizado de máquina é usada para agrupar dados não rotulados em
grupos com base em características semelhantes?
a) Regressão Linear
b) K-Nearest Neighbors
c) K-Means Clustering
d) Árvore de Decisão
e) Regressão Logística
Questão 9
Em redes neurais, o que é uma camada convolucional?
a) Uma camada responsável pela classificação dos dados.
b) Uma camada que agrupa os dados de entrada em diferentes classes.
c) Uma camada que aplica um filtro para extrair características locais dos dados.
d) Uma camada que calcula a saída final do modelo.
e) Uma camada que realiza a redução de dimensionalidade dos dados.
Questão 10
Em que tipo de problema o algoritmo K-Nearest Neighbors (K-NN) é mais indicado?
a) Problemas de classificação com grandes conjuntos de dados rotulados.
b) Problemas de regressão com dados temporais.
c) Problemas de agrupamento de dados com variáveis contínuas.
d) Problemas de classificação e regressão baseados na proximidade entre os dados.
e) Problemas de classificação binária apenas.
Gabarito e Justificativa
1. b)
○ O overfitting ocorre quando o modelo aprende detalhes e ruídos dos dados
de treinamento a ponto de prejudicar sua capacidade de generalizar para
novos dados.
2. b)
○ Cross-validation é uma técnica de avaliação onde os dados de treinamento
são divididos em várias partes, e o modelo é treinado e validado em
diferentes subconjuntos, ajudando a medir a performance de forma mais
robusta.
3. d)
○ A regressão logística é amplamente utilizada em problemas de classificação
binária, onde o objetivo é prever uma variável categórica com duas classes.
4. c)
○ O modelo de regressão é usado para prever valores contínuos com base em
variáveis independentes, como a previsão de preços ou temperaturas.
5. b)
○ A Análise de Componentes Principais (PCA) é uma técnica de redução de
dimensionalidade que projeta os dados em um espaço de menor
dimensionalidade, mantendo a maior parte da variabilidade dos dados.
6. c)
○ A variável dependente é a variável alvo, ou seja, a que o modelo tenta prever
a partir das variáveis independentes (entradas).
7. b)
○ O algoritmo de otimização ajusta os parâmetros do modelo (por exemplo,
pesos em redes neurais) de forma a minimizar a função de custo,
melhorando a precisão do modelo.
8. c)
○ O K-Means Clustering é um algoritmo de aprendizado não supervisionado
utilizado para agrupar dados não rotulados em clusters com base em
características semelhantes.
9. c)
○ Em redes neurais convolucionais, a camada convolucional aplica filtros para
extrair características locais dos dados, especialmente útil em imagens e
vídeos.
10. d)
● O K-Nearest Neighbors (K-NN) é um algoritmo de classificação e regressão baseado
na proximidade entre os dados, considerando os K vizinhos mais próximos para
fazer a previsão.

Prova de Ciência de Dados_ Fundamentos e Aplicações de Machine Learning

Outros

Ferramentas de estudo

Qual algoritmo é tipicamente utilizado para problemas de classificação binária?
a) Regressão Linear
b) Árvore de Decisão
c) K-Means
d) Regressão Logística
e) Redes Neurais Convolucionais

Qual técnica de aprendizado de máquina é usada para agrupar dados não rotulados em grupos com base em características semelhantes?
a) Regressão Linear
b) K-Nearest Neighbors
c) K-Means Clustering
d) Árvore de Decisão
e) Regressão Logística

Conteúdos escolhidos para você

Prova de Ciência de Dados_ Algoritmos e Técnicas de Aprendizado Supervisionado e Não Supervisionado

Prova de Ciência de Dados_ Algoritmos de Machine Learning e Suas Aplicações

Métodos de Análise de Dados e Avaliação de Modelos Estatísticos

Fundamentos de Machine Learning e Modelagem Preditiva(1)

Métodos Avançados de Estatística e Machine Learning

Perguntas dessa disciplina

Pergunta 1 Qual é a principal característica do aprendizado não supervisionado? a. Aprende a partir de dados sem rótulos. b. Utiliza dados rotulados.

Uma empresa de e-commerce coletou dados de comportamento de compra de seus clientes durante os últimos três anos, incluindo informações demográfica...

Associe cada etapa da construção de um modelo de regressão linear múltipla com sua descrição correta, considerando a importância de cada uma para gara

Pergunta 1. Os Sistemas de Informação Geográfica (SIG) permitem a integração e análise de diferentes tipos de dados geoespaciais organizados em camada

A aplicação de Machine Learning (ML) em IoT tem como objetivo prever eventos com base em padrões históricos de dados sensoriais. Entre os algoritmo...

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Qual algoritmo é tipicamente utilizado para problemas de classificação binária?
a) Regressão Linear
b) Árvore de Decisão
c) K-Means
d) Regressão Logística
e) Redes Neurais Convolucionais

Qual técnica de aprendizado de máquina é usada para agrupar dados não rotulados em grupos com base em características semelhantes?
a) Regressão Linear
b) K-Nearest Neighbors
c) K-Means Clustering
d) Árvore de Decisão
e) Regressão Logística

Conteúdos escolhidos para você

Prova de Ciência de Dados_ Algoritmos e Técnicas de Aprendizado Supervisionado e Não Supervisionado

Prova de Ciência de Dados_ Algoritmos de Machine Learning e Suas Aplicações

Métodos de Análise de Dados e Avaliação de Modelos Estatísticos

Fundamentos de Machine Learning e Modelagem Preditiva(1)

Métodos Avançados de Estatística e Machine Learning

Perguntas dessa disciplina

Pergunta 1 Qual é a principal característica do aprendizado não supervisionado? a. Aprende a partir de dados sem rótulos. b. Utiliza dados rotulados.

Uma empresa de e-commerce coletou dados de comportamento de compra de seus clientes durante os últimos três anos, incluindo informações demográfica...

Associe cada etapa da construção de um modelo de regressão linear múltipla com sua descrição correta, considerando a importância de cada uma para gara

Pergunta 1. Os Sistemas de Informação Geográfica (SIG) permitem a integração e análise de diferentes tipos de dados geoespaciais organizados em camada

A aplicação de Machine Learning (ML) em IoT tem como objetivo prever eventos com base em padrões históricos de dados sensoriais. Entre os algoritmo...

Mais conteúdos dessa disciplina

Prova de Ciência de Dados_ Fundamentos e Aplicações de Machine Learning

Outros

Ferramentas de estudo

Qual algoritmo é tipicamente utilizado para problemas de classificação binária?a) Regressão Linearb) Árvore de Decisãoc) K-Meansd) Regressão Logísticae) Redes Neurais Convolucionais

Qual técnica de aprendizado de máquina é usada para agrupar dados não rotulados em grupos com base em características semelhantes?a) Regressão Linearb) K-Nearest Neighborsc) K-Means Clusteringd) Árvore de Decisãoe) Regressão Logística

Conteúdos escolhidos para você

Prova de Ciência de Dados_ Algoritmos e Técnicas de Aprendizado Supervisionado e Não Supervisionado

Prova de Ciência de Dados_ Algoritmos de Machine Learning e Suas Aplicações

Métodos de Análise de Dados e Avaliação de Modelos Estatísticos

Fundamentos de Machine Learning e Modelagem Preditiva(1)

Métodos Avançados de Estatística e Machine Learning

Perguntas dessa disciplina

Pergunta 1 Qual é a principal característica do aprendizado não supervisionado? a. Aprende a partir de dados sem rótulos. b. Utiliza dados rotulados.

Uma empresa de e-commerce coletou dados de comportamento de compra de seus clientes durante os últimos três anos, incluindo informações demográfica...

Associe cada etapa da construção de um modelo de regressão linear múltipla com sua descrição correta, considerando a importância de cada uma para gara

Pergunta 1. Os Sistemas de Informação Geográfica (SIG) permitem a integração e análise de diferentes tipos de dados geoespaciais organizados em camada

A aplicação de Machine Learning (ML) em IoT tem como objetivo prever eventos com base em padrões históricos de dados sensoriais. Entre os algoritmo...

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Qual algoritmo é tipicamente utilizado para problemas de classificação binária?a) Regressão Linearb) Árvore de Decisãoc) K-Meansd) Regressão Logísticae) Redes Neurais Convolucionais

Qual técnica de aprendizado de máquina é usada para agrupar dados não rotulados em grupos com base em características semelhantes?a) Regressão Linearb) K-Nearest Neighborsc) K-Means Clusteringd) Árvore de Decisãoe) Regressão Logística

Conteúdos escolhidos para você

Prova de Ciência de Dados_ Algoritmos e Técnicas de Aprendizado Supervisionado e Não Supervisionado

Prova de Ciência de Dados_ Algoritmos de Machine Learning e Suas Aplicações

Métodos de Análise de Dados e Avaliação de Modelos Estatísticos

Fundamentos de Machine Learning e Modelagem Preditiva(1)

Métodos Avançados de Estatística e Machine Learning

Perguntas dessa disciplina

Pergunta 1 Qual é a principal característica do aprendizado não supervisionado? a. Aprende a partir de dados sem rótulos. b. Utiliza dados rotulados.

Uma empresa de e-commerce coletou dados de comportamento de compra de seus clientes durante os últimos três anos, incluindo informações demográfica...

Associe cada etapa da construção de um modelo de regressão linear múltipla com sua descrição correta, considerando a importância de cada uma para gara

Pergunta 1. Os Sistemas de Informação Geográfica (SIG) permitem a integração e análise de diferentes tipos de dados geoespaciais organizados em camada

A aplicação de Machine Learning (ML) em IoT tem como objetivo prever eventos com base em padrões históricos de dados sensoriais. Entre os algoritmo...

Mais conteúdos dessa disciplina

Qual algoritmo é tipicamente utilizado para problemas de classificação binária?
a) Regressão Linear
b) Árvore de Decisão
c) K-Means
d) Regressão Logística
e) Redes Neurais Convolucionais

Qual técnica de aprendizado de máquina é usada para agrupar dados não rotulados em grupos com base em características semelhantes?
a) Regressão Linear
b) K-Nearest Neighbors
c) K-Means Clustering
d) Árvore de Decisão
e) Regressão Logística

Qual algoritmo é tipicamente utilizado para problemas de classificação binária?
a) Regressão Linear
b) Árvore de Decisão
c) K-Means
d) Regressão Logística
e) Redes Neurais Convolucionais

Qual técnica de aprendizado de máquina é usada para agrupar dados não rotulados em grupos com base em características semelhantes?
a) Regressão Linear
b) K-Nearest Neighbors
c) K-Means Clustering
d) Árvore de Decisão
e) Regressão Logística