Logo Passei Direto
Buscar

Prova de Ciência de Dados_ Processos e Análise

User badge image
Tocurioso

em

Ferramentas de estudo

Questões resolvidas

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Prévia do material em texto

Prova de Ciência de Dados: Processos e Análise
Introdução:
Esta prova explora aspectos técnicos e práticos da análise de dados e construção de 
modelos na Ciência de Dados. Responda as questões baseando-se em seus 
conhecimentos sobre as etapas e metodologias da área.
Questão 1
Qual é a etapa inicial do processo de Ciência de Dados?
a) Coleta de dados.
b) Preparação de dados.
c) Modelagem de algoritmos.
d) Validação de resultados.
e) Entendimento do problema de negócios.
Questão 2
Qual é o objetivo de um modelo de classificação?
a) Prever valores contínuos com base em variáveis independentes.
b) Agrupar dados em categorias não rotuladas.
c) Identificar padrões em dados não supervisionados.
d) Prever categorias ou classes com base em dados rotulados.
e) Reduzir a dimensionalidade dos dados.
Questão 3
O que é o método de eliminação recursiva de variáveis (Recursive Feature Elimination - 
RFE)?
a) Uma técnica para avaliar o desempenho de um modelo.
b) Um método para selecionar as variáveis mais importantes para um modelo.
c) Um processo de balanceamento de dados desbalanceados.
d) Uma técnica de redução de dimensionalidade para variáveis categóricas.
e) Um algoritmo de agrupamento para dados grandes.
Questão 4
O que é uma rede neural convolucional (Convolutional Neural Network - CNN) comumente 
usada?
a) Análise de texto em PLN.
b) Processamento de dados tabulares.
c) Visualização de dados em gráficos dinâmicos.
d) Processamento de imagens e visão computacional.
e) Análise estatística de séries temporais.
Questão 5
Qual é o principal benefício da regularização em aprendizado de máquina?
a) Aumentar a complexidade do modelo para ajustar os dados.
b) Melhorar a capacidade de generalização ao penalizar pesos extremos.
c) Reduzir o tempo de treinamento do modelo.
d) Balancear conjuntos de dados desbalanceados.
e) Maximizar o desempenho de modelos não supervisionados.
Questão 6
O que é precision em métricas de classificação?
a) A proporção de verdadeiros positivos em relação a todas as previsões positivas.
b) A proporção de verdadeiros positivos em relação ao total de casos reais positivos.
c) A proporção de casos corretamente previstos entre todos os casos.
d) A diferença entre as previsões do modelo e os valores reais.
e) A taxa de falsos negativos no modelo.
Questão 7
Qual é a diferença principal entre aprendizado supervisionado e não supervisionado?
a) A disponibilidade ou ausência de rótulos nos dados.
b) A complexidade dos algoritmos usados.
c) A aplicação restrita a dados estruturados no aprendizado supervisionado.
d) A necessidade de validação cruzada no aprendizado não supervisionado.
e) A utilização de técnicas de regressão em ambos.
Questão 8
O que é clustering em Ciência de Dados?
a) Uma técnica de aprendizado supervisionado para prever categorias.
b) Um método para dividir dados em grupos com características semelhantes.
c) Uma forma de validar a performance de modelos preditivos.
d) Um algoritmo exclusivo para redução de dimensionalidade.
e) Uma ferramenta usada apenas em séries temporais.
Questão 9
Qual técnica é utilizada para detecção de anomalies?
a) Regressão Linear.
b) Isolation Forest.
c) K-Nearest Neighbors (KNN).
d) PCA (Análise de Componentes Principais).
e) Todas as anteriores.
Questão 10
Qual métrica é mais usada para avaliar modelos de regressão?
a) Acurácia.
b) Recall.
c) RMSE (Raiz do Erro Quadrático Médio).
d) Matriz de confusão.
e) F1-Score.
Gabarito e Justificativa
1. e)
○ O entendimento do problema de negócios é crucial para direcionar todo o 
processo de Ciência de Dados.
2. d)
○ Modelos de classificação são usados para prever categorias ou classes.
3. b)
○ O RFE seleciona as variáveis mais importantes, otimizando o modelo.
4. d)
○ Redes neurais convolucionais são amplamente usadas no processamento de
imagens.
5. b)
○ Regularização penaliza pesos extremos, reduzindo o overfitting e 
melhorando a generalização.
6. a)
○ Precision mede a proporção de verdadeiros positivos entre todas as 
previsões positivas.
7. a)
○ A principal diferença é a presença ou ausência de rótulos nos dados.
8. b)
○ Clustering agrupa dados com características semelhantes em aprendizado 
não supervisionado.
9. e)
○ Todas as opções podem ser usadas para detectar anomalias, dependendo 
do contexto.
10. c)
○ RMSE é amplamente utilizado para avaliar a performance de modelos de 
regressão.

Mais conteúdos dessa disciplina