Logo Passei Direto
Buscar

Análise de Ferramentas de Data Mining

Questionário da disciplina Introdução à Ciência de Dados com questões de múltipla escolha sobre ferramentas de data mining (agrupamentos, regras, árvores, grafos/dendrogramas), aprendizado de máquina/IA, Python, estatística inferencial, Big Data (tipos) e técnicas não supervisionadas (k‑médias, PCA, clusterização).

Ferramentas de estudo

Questões resolvidas

No aprendizado não supervisionado não existem resultados pré-definidos para o modelo utilizar como referência para aprender.
Indique quais são as técnicas que representam este aprendizado.


a. Binária e Não Binária; Previsão de Churn; k-médias, análise de componentes principais
b. redes neurais artificiais, máquina de suporte vetorial, k-médias, análise de componentes principais.
c. k-médias, análise de componentes principais, clusterização hierárquica; regressão linear, regressão logística.
d. Árvore de Decisão Continua, Binária e Não Binária; Previsão de Churn e Leitura de Upsell and Cross-Sell.
e. k-médias, análise de componentes principais, clusterização. hierárquica.decomposição em valores singulares, clusterização baseada em densidade, modelo de mistura Gaussiana.

Marque a alternativa que apresenta uma vantagem de se utilizar a Linguagem Python:

a. Python é usado para criar interfaces gráficas de usuário (GUI).
b. Multiplataforma.
c. Python é usado para “Scripting and Automation”.
d. Python é usado no desenvolvimento da Web.
e. Todas as alternativas estão corretas.

São soluções utilizadas no fluxo de coleta de dados do ETL.

a. Scikit-learn, numpy.
b. Snowplow; segment.
c. Todas as alternativas estão corretas.
d. Hive; spark.
e. Sqoop; hive.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

No aprendizado não supervisionado não existem resultados pré-definidos para o modelo utilizar como referência para aprender.
Indique quais são as técnicas que representam este aprendizado.


a. Binária e Não Binária; Previsão de Churn; k-médias, análise de componentes principais
b. redes neurais artificiais, máquina de suporte vetorial, k-médias, análise de componentes principais.
c. k-médias, análise de componentes principais, clusterização hierárquica; regressão linear, regressão logística.
d. Árvore de Decisão Continua, Binária e Não Binária; Previsão de Churn e Leitura de Upsell and Cross-Sell.
e. k-médias, análise de componentes principais, clusterização. hierárquica.decomposição em valores singulares, clusterização baseada em densidade, modelo de mistura Gaussiana.

Marque a alternativa que apresenta uma vantagem de se utilizar a Linguagem Python:

a. Python é usado para criar interfaces gráficas de usuário (GUI).
b. Multiplataforma.
c. Python é usado para “Scripting and Automation”.
d. Python é usado no desenvolvimento da Web.
e. Todas as alternativas estão corretas.

São soluções utilizadas no fluxo de coleta de dados do ETL.

a. Scikit-learn, numpy.
b. Snowplow; segment.
c. Todas as alternativas estão corretas.
d. Hive; spark.
e. Sqoop; hive.

Prévia do material em texto

Iniciado em terça, 1 out 2024, 00:18
Estado Finalizada
Concluída em terça, 1 out 2024, 00:25
Tempo
empregado
6 minutos 41 segundos
Avaliar 2,00 de um máximo de 2,00(100%)
Questão 1
Correto
Atingiu 0,20 de 0,20
Ferramentas de  Data Mining  são responsáveis por analisar, e descobrir impedimentos relacionados aos dados ou novas
perspectivas, que apontam um comportamento recente nos negócios. As técnicas que estas ferramentas utilizam são:
a. Árvore de decisão e grafos; Previsão de Churn e Leitura de Upsell and Cross-Sell
b. Agrupamentos; hipóteses; Binária e Não Binária; Previsão de Churn e Leitura de Upsell and Cross-Sell
c. Dendrogramas; Previsão de Churn; hipóteses
d. Árvore de decisão contínua, Binária e Não Binária; Previsão de Churn e Leitura de Upsell and Cross-Sell
e. Agrupamentos; hipóteses; regras; árvores de decisão e grafos ou dendrogramas.
Sua resposta está correta.
A resposta correta é: Agrupamentos; hipóteses; regras; árvores de decisão e grafos ou dendrogramas.
Painel / Minhas Disciplinas
/ 2ºGRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO-disc. 13- INTRODUÇÃO A CIÊNCIA DE DADOS/ALGORITIMOS E LÓGICA DE PROGRA
/ DISCIPLINA - INTRODUÇÃO À CIÊNCIA DE DADOS
/ AB30 - ATIVIDADE DE ESTUDO - INTRODUÇÃO À CIÊNCIA DE DADOS - ATÉ 27/10/2024 - VALOR 2,0 PONTOS
https://www.eadunifatecie.com.br/course/view.php?id=48893
https://www.eadunifatecie.com.br/course/view.php?id=48893
https://www.eadunifatecie.com.br/my/
https://www.eadunifatecie.com.br/course/view.php?id=48893
https://www.eadunifatecie.com.br/course/view.php?id=48893#section-1
https://www.eadunifatecie.com.br/mod/quiz/view.php?id=1578729
Questão 2
Correto
Atingiu 0,20 de 0,20
Questão 3
Correto
Atingiu 0,20 de 0,20
O aprendizado de máquina (em inglês, machine learning) é um método de análise de dados que automatiza a construção de
modelos analíticos, é um ramo da ____________________.
a. Algoritmo por Reforço.
b. Deep Blue.
c. Inteligência Artificial.
d. Algoritmo Supervisionado.
e. Algoritmo Não Supervisionado.
Sua resposta está correta.
A resposta correta é: Inteligência Artificial.
Python é uma linguagem de programação com objetivos diversos, é administrada pela Python Software Foundation que detém
a propriedade intelectual relacionada a ela, o Python é gratuito, e pode ser usado para fins comerciais. Sobre Python é correto
afirmar:
a. De forte tipagem e dinâmica e estruturada.
b. Executada apenas em ambiente Linux.
c. Executada apenas em ambiente Linux e Windows.
d. Estruturada, funcional, de forte tipagem e dinâmica.
e. Orientada a objetos, funcional, de forte tipagem e dinâmica.
Sua resposta está correta.
A resposta correta é: Orientada a objetos, funcional, de forte tipagem e dinâmica.
https://www.sas.com/pt_br/insights/analytics/analytics.html
Questão 4
Correto
Atingiu 0,20 de 0,20
Questão 5
Correto
Atingiu 0,20 de 0,20
Inferir é deduzir um resultado, por lógica, com base na interpretação de outras informações, sobre Estatística inferencial é
correto afirmar:
a. Está focada na apresentação dos dados, mas não procura fazer inferências ou tirar sólidas conclusões que podem ser
usadas para prever futuros dados da amostra.
b. Visa descrever e organizar os dados com objetivo de facilitar a compreensão e utilização das informações que serão
extraídas.
c. São os métodos usados para visualizar dados (data visualization)
d. Pode ser definida como um conjunto de procedimentos estatísticos que têm por finalidade tirar sólidas conclusões
que podem ser usadas para prever futuros dados de uma amostra para uma população.

e. Permite a descrição de fenômenos aleatórios oriundos das incertezas.
Sua resposta está correta.
A resposta correta é: Pode ser definida como um conjunto de procedimentos estatísticos que têm por finalidade tirar sólidas
conclusões que podem ser usadas para prever futuros dados de uma amostra para uma população.
A proposta de uma solução de Big Data é oferecer uma abordagem consistente no tratamento do constante crescimento e da
complexidade dos dados. Os dados podem ser encontrados de três formas:
a. Estruturado; Não estruturado e Semi-estruturado.
b. Básico; Médio e Avançado.
c. Fácil; Difícil e Avançado.
d. String; Numérico e Float.
e. Char; Boolean e Avançado.
Sua resposta está correta.
A resposta correta é: Estruturado; Não estruturado e Semi-estruturado.
Questão 6
Correto
Atingiu 0,20 de 0,20
Questão 7
Correto
Atingiu 0,20 de 0,20
No aprendizado não supervisionado não existem resultados pré-definidos para o modelo utilizar como referência para
aprender. Indique quais são as técnicas que representam este aprendizado.
a. redes neurais artificiais, máquina de suporte vetorial, k-médias, análise de componentes principais.
b. Árvore de Decisão Continua, Binária e Não Binária; Previsão de Churn e Leitura de Upsell and Cross-Sell.
c. k-médias, análise de componentes principais, clusterização. hierárquica.decomposição em valores singulares,
clusterização baseada em densidade, modelo de mistura Gaussiana.

d. k-médias, análise de componentes principais, clusterização hierárquica; regressão linear, regressão logística.
e. Binária e Não Binária; Previsão de Churn; k-médias, análise de componentes principais
Sua resposta está correta.
A resposta correta é: k-médias, análise de componentes principais, clusterização. hierárquica.decomposição em valores
singulares, clusterização baseada em densidade, modelo de mistura Gaussiana.
Marque a alternativa que apresenta uma vantagem de se utilizar a Linguagem Python
a. Python é usado para criar interfaces gráficas de usuário (GUI).
b. Multiplataforma.
c. Python é usado para “Scripting and Automation”.
d. Python é usado no desenvolvimento da Web.
e. Todas as alternativas estão corretas.
Sua resposta está correta.
A resposta correta é: Todas as alternativas estão corretas.
Questão 8
Correto
Atingiu 0,20 de 0,20
Questão 9
Correto
Atingiu 0,20 de 0,20
MatplotLib - é uma biblioteca de visualização de dados do Python.
a. A ferramenta permite a elaboração apenas de arrays unidimensionais e bidimensionais
b. A ferramenta permite a elaboração de diversos tipos de gráficos, como em barra, em linha, em pizza, histogramas
entre outras opções.

c. Suas principais funções são: read_cvs (); head (); memory_usage (); describe (); loc[:]; astype (); value_counts ();
sort_values (); drop_duplicates () e merge ().
d. Com o MatplotLib é possível criar visualizações apenas dinâmicas, e numéricas
e. Suas principais funções são: read_cvs (); head (); scikit-learn, NumPy e Kivy
Sua resposta está correta.
A resposta correta é: A ferramenta permite a elaboração de diversos tipos de gráficos, como em barra, em linha, em pizza,
histogramas entre outras opções.
São soluções utilizadas no fluxo de coleta de dados do ETL.
a. Scikit-learn, numpy.
b. Snowplow; segment.
c. Todas as alternativas estão corretas.
d. Hive; spark.
e. Sqoop; hive.
Sua resposta está correta.
A resposta correta é: Snowplow; segment.
Questão 10
Correto
Atingiu 0,20 de 0,20
A aprendizagem supervisionada é um ramo do aprendizado de máquina, um método de análise de dados que usa algoritmos
que aprendem iterativamente. Indique quais são as técnicas que representam este aprendizado.
a. Naive Bayes, Redes neurais artificiais.
b. Redes neurais artificiais, máquina de suporte vetorial.
c. Classificação e Regressão.
d. Árvores de decisão, k-vizinhos.
e. Regressão logística; Máquina de suporte vetorial.
Sua resposta está correta.
A resposta correta é: Classificação e Regressão.
◄ CLIQUE AQUI PARA ACESSAR AS AULAS DE INTRODUÇÃO À CIÊNCIA DE DADOS
Seguir para...
APOSTILA DA DISCIPLINA ►
https://www.tibco.com/pt-br/reference-center/what-is-machine-learning
https://www.eadunifatecie.com.br/mod/book/view.php?id=1578728&forceview=1
https://www.eadunifatecie.com.br/mod/resource/view.php?id=1578730&forceview=1

Mais conteúdos dessa disciplina