Buscar

Teste Final DATA MINING

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

11/10/2020 Blackboard Learn
https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 1/5
Curso DATA MINING
Teste Teste Final
Iniciado 11/10/20 18:24
Enviado 11/10/20 19:45
Status Completada
Resultado da tentativa 10 em 10 pontos 
Tempo decorrido 1 hora, 21 minutos
Resultados exibidos Respostas enviadas, Respostas corretas, Comentários
Pergunta 1
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
A mineração de dados é um processo relacionado às áreas de Ciência de Dados e Big Data
responsável por integrar um processamento maior dentro da análise de dados, que consiste em
diferentes etapas. Esse processo permite que os dados sejam extraídos e trabalhados a partir de um
dataset. 
 
Nesse sentido, assinale a alternativa que define a etapa imediatamente anterior à da mineração de
dados.
Transformar os dados conforme um padrão.
Transformar os dados conforme um padrão.
Resposta correta. Após as etapas de seleção de de pré-processamento, será na fase da
transformação dos dados que ocorrerá a conversão dos dados brutos em um formato
padrão que seja possível de filtrar e utilizar para a análise estatística,, de forma que os
dados estejam melhor relacionados entre si e que possam ser analisados
posteriormente.
Pergunta 2
Resposta
Selecionada:
Resposta Correta:
Feedback
da
resposta:
Na atualidade, os dados são gerados continuamente pelas mais diversas fontes. Ao acessar um site,
por exemplo, uma única pessoa gera dados relacionados aos cliques e movimentos do mouse, às
palavras que escreve na tela, aos termos que busca no Google e aos conteúdos pelos quais se
interessa. Pensando nos milhões de usuários que acessam a internet 24h por dia, o volume de dados
gerado a cada segundo é impressionante.
 
Com base nisso, assinale a alternativa correta.
Big Data é a evolução das tecnologias e arquiteturas relacionadas às bases de
dados.
Big Data é a evolução das tecnologias e arquiteturas relacionadas às bases de
dados.
Resposta correta. Não é à toa que um dos “5 Vs” de Big Data seja Velocidade. Para
comportar grandes volumes de dados, as tecnologias envolvidas também precisaram
melhorar em termos de processamento - só assim foi possível acompanhar e dar suporte
à entrada contínua de dados na rede.
Pergunta 3
Leia o excerto a seguir sobre métodos de treinamento e teste: 
 
"Na maioria das redes neurais esses parâmetros correspondem aos valores dos pesos da rede e à sua
arquitetura (número de camadas e/ou neurônios); nas árvores de decisão esses parâmetros são os
nós da árvore, sua arquitetura (profundidade e conexões) e as condições a serem associadas a cada
arco; e nas regras de decisão os parâmetros são os antecedentes e consequentes de cada regra e o
número total de regras." 
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e
aplicações. São Paulo: Saraiva, 2016, pág. 175. 
1 em 1 pontos
1 em 1 pontos
1 em 1 pontos
11/10/2020 Blackboard Learn
https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 2/5
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
 
Pensando nas possíveis aplicações das técnicas de treinamento, avalie as seguintes afirmações: 
 
I. Redes Neurais, Árvores de Decisão e Indução de Regras são técnicas que se utilizam de
Inteligência Artificial. 
II. Agrupamento é o mesmo que classificação ou clustering, e serve para identificar subconjuntos de
dados. 
III. A pontuação é uma técnica que pode variar a partir da integração com outro método - o HMEQ. 
IV. As Árvores de Decisão usam uma técnica estatística complexa, de modo que são pouco usadas em
análise de dados. 
 
É correto o que se afirma em:
I, II e III, apenas.
I, II e III, apenas.
Resposta correta. As técnicas de Árvore de Decisão, Indução de Regras e Redes
Neurais usam inteligência artificial porque permitem inserir parâmetros de treinamento,
ou seja, que envolve aprendizado de máquina. O uso das Árvores de Decisão envolve
conceitos estatísticos simples, sendo uma técnica muito recorrente em análise de dados,
e o agrupamento, também conhecido como clustering, permite identificar subconjuntos a
partir de padrões, sendo que demais técnicas envolvem comparação de modelos,
pontuação, pontuação HMEQ e lista de riscos.
Pergunta 4
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
A prática de análise de dados não é uma novidade para as empresas. Desde o tempo de arquivos em
papel, era necessário ter uma equipe ou um especialista dedicado a organizar, filtrar e analisar as
informações contidas nas bases de dados físicas. Para tanto, foi desenvolvido o método KDD, que
consiste em um processo de descoberta de conhecimento dividido em várias etapas. Sobre as etapas
de análise de dados pelo método KDD, avalie os itens a seguir:
 
I. Mineração de dados
II. Avaliação
III. Seleção
IV. Pré-processamento
V. Transformação
 
Agora assinale a alternativa que representa a ordem correta dessas etapas:
IV, III, V, I, II.
IV, III, V, I, II.
Resposta correta. O KDD é um método que envolve a seleção dos dados, o pré-
processamento, a transformação, a mineração dos dados e a avaliação dos resultados
obtidos. Esse método funciona com qualquer quantidade de dados, e para qualquer
finalidade. Sendo um padrão consistente, continua sendo adotado na Ciência de Dados.
Pergunta 5
Sobre análise descritiva de dados, leia o parágrafo a seguir: 
 
"As análises descritivas permitem uma sumarização e compreensão dos objetos da base e seus
atributos, como qual o salário médio dos professores universitários brasileiros ou qual a distribuição
salarial desses professores.” 
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e
aplicações. São Paulo: Saraiva, 2016, pág. 29. 
 
Com base nisso, avalie as asserções a seguir e a relação proposta entre elas: 
 
I. A partir da análise descritiva de dados, é possível prever o maior período de vendas de um e-
commerce 
PORQUE, 
II. havendo uma base de dados com informações sobre os períodos de venda anteriores, há como
verificar a existência de padrões a partir da mineração de dados. 
1 em 1 pontos
1 em 1 pontos
11/10/2020 Blackboard Learn
https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 3/5
Resposta
Selecionada:
Resposta Correta:
Feedback
da
resposta:
 
Assinale a alternativa correta:
A asserção II é uma proposição verdadeira e a asserção I é uma proposição
falsa.
A asserção II é uma proposição verdadeira e a asserção I é uma proposição
falsa.
Resposta correta. A análise descritiva de dados é usada junto à estatística exploratória,
ou seja, usa medidas de centro e de variação para analisar frequências, probabilidades e
compreender melhor os padrões de um conjunto de dados. Usa-se, para isso, da média,
da moda e da mediana, além de medidas de dispersão para encontrar a Amplitude, a
Variância e o Desvio Padrão. Assim sendo, a asserção II é verdadeira e justifica a
asserção I, contudo a asserção I é falsa, pois não é a análise descritiva de dados que
usamos para prever tendências, e sim a análise preditiva.
Pergunta 6
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
As etapas de mineração de dados de utilizam ferramentas, técnicas e algoritmos de algumas
diferentes áreas do conhecimento para trabalhar com um conjunto de dados, a partir do qual serão
extraídas as informações necessárias, conforme os objetivos de pesquisa ou de negócio. Sobre as
áreas relacionadas à mineração de dados, associe os itens a seguir aos seus correspondentes:
 
(1) Big Data.
(2) Inteligência Artificial.
(3) Estatística.
 
( ) Validação de dados.
( ) Aprendizado de máquina.
( ) Manipulação de dados.
 
Assinale a alternativa correta.
3, 2, 1.
3, 2, 1.
Resposta correta. Você realizou a associação correta entre 1. (Big Data - Manipulação de
dados), 2. (Inteligência Artificial - Aprendizado de máquina) e 3. Estatística (Validação dedados). Isso porque, enquanto as tecnologias de banco de dados associadas ao Big Data
evoluíram para acomodar grandes volumes a maiores taxas de processamento, a
Estatística funciona para avaliar resultados e validá-los, e o aprendizado de máquina só é
possível por conta dos estudos de inteligência artificial.
Pergunta 7
Resposta
Sobre as tecnologias relacionadas a mineração de dados e Big Data, leia o excerto a seguir:
 
"Pesquisadores consideram que estamos vivenciando o início de uma nova revolução industrial, na
qual os dados passam a ser elementos chaves dessa mudança. Podemos concluir, portanto, que esse
é o momento ideal para criarmos oportunidades a partir dos dados."
 
MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São
Paulo: Casa do Código, 2017, pág. 8.
 
Com base nisso, analise as asserções a seguir e a relação proposta entre elas:
 
I. Big Data é uma área de inovações voltada ao processamento de grandes volumes de dados
PORQUE
II. as tecnologias e arquiteturas envolvidas permitem alta velocidade de coleta, novas descobertas e
diversos processos de análise.
 
A seguir, assinale a alternativa correta.
1 em 1 pontos
1 em 1 pontos
11/10/2020 Blackboard Learn
https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 4/5
Selecionada:
Resposta Correta:
Feedback
da
resposta:
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa
correta da I.
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa
correta da I.
Resposta correta. Embora as suas afirmações sejam verdadeiras, o que é afirmado na
asserção II não justifica o que foi exposto na I. Isso porque as tecnologias e arquiteturas
relacionadas ao Big Data são o meio que permite que os bancos de dados funcionem e
suportem o processamento ao grande volume de dados, mas essas tecnologias não
promoveram a revolução do Big Data, em si - elas apenas evoluíram de modo a
acompanhar essa tendência.
Pergunta 8
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
Leia o trecho a seguir:
 
“É comum, ao ouvir pela primeira vez o termo Big Data, pensarmos que ele está unicamente
relacionado a um grande volume de dados (o que é normal, já que o nome diz exatamente isso).
Entretanto, o volume de dados não é sua única característica.”.
 
MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São
Paulo: Casa do Código, 2017, pág. 8.
 
Esse trecho é uma introdução da autora aos termos que designam os “5 Vs” de Big Data, sendo um
deles o volume, que costuma ser o mais associado a uma grande base de dados, por motivos óbvios.
Entretanto, há outras características que devem ser consideradas. Nesse sentido, leia e relacione
cada um dos termos dos “5 Vs” às suas características correspondentes:
 
(1) Volume.
(2) Velocidade.
(3) Veracidade.
(4) Variedade.
(5) Valor.
 
( ) Confiabilidade.
( ) Eventos estatísticos.
( ) Tipos de dados.
( ) Registros.
( ) Coleta de dados.
 
A partir das relações feitas anteriormente, assinale a alternativa que apresenta a sequência correta:
3, 5, 4, 1, 2.
3, 5, 4, 1, 2.
Resposta correta. A confiabilidade está associada à integridade e Veracidade dos dados,
sendo um dos “5 Vs”; o Valor está associado a eventos estatísticos, que permitem
confirmar ou refutar uma hipótese, por exemplo; já os tipos de dados, que podem ser
estruturados ou não estruturados, configuram a Variedade; e a Velocidade está
relacionada a quão rapidamente os dados são coletados e posteriormente registrados em
suas bases de dados; esses registros dizem respeito, assim, ao Volume.
Pergunta 9
Sobre detecção de anomalias, leia o trecho a seguir:
 
"Uma base de dados pode conter objetos que não seguem o comportamento ou não possuem a
característica comum dos dados ou de um modelo que os represente. Esses dados são conhecidos
como anomalias ou valores discrepantes (outliers)."
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e
aplicações. São Paulo: Saraiva, 2016, pág. 31.
 
Sobre os outliers (ou pontos fora da curva), analise as asserções a seguir e a relação proposta entre
1 em 1 pontos
1 em 1 pontos
11/10/2020 Blackboard Learn
https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 5/5
Resposta
Selecionada:
Resposta Correta:
Feedback
da
resposta:
elas:
 
I. Os outliers 
são considerados ruídos e às vezes filtrados automaticamente pela ferramenta utilizada, mas, em
alguns casos devem ser mantidos
PORQUE,
II. em uma análise que objetiva a detecção de fraude, por exemplo, as anomalias podem conter
informações significativas.
 
Assinale a alternativa correta.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa
correta da I.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa
correta da I.
Resposta correta. Sabendo que no caso de detecção de fraude o ponto fora da curva é
justamente aquele que pode indicar uma atividade fora do comum, os outliers podem, de
fato, serem considerados dados importantes e significativos, de modo que a asserção II é
uma justificativa correta da asserção I.
Pergunta 10
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
Leia o trecho a seguir:
 
"A mineração de dados envolve conhecimento de áreas como banco de dados, estatística,
aprendizagem de máquina, computação de alto desempenho, reconhecimento de padrões,
computação natural, visualização de dados, recuperação de informação, processamento de imagens e
de sinais, análise espacial de dados, inteligência artificial, entre outras."
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e
aplicações. São Paulo: Saraiva, 2016, pág. 28.
 
Nesse sentido, há muitos conteúdos que se cruzam e que dão respaldo à mineração de dados, de
modo que um bom cientista de dados ou analista de B.I. - Business Intelligence deve apresentar
habilidades que vão desde a noção de mercado e negócios até estatística e programação. Com isso
em mente, assinale a palavra que resume a condição desse campo de atuação de Big Data:
Multidisciplinar e interdisciplinar.
Multidisciplinar e interdisciplinar.
Resposta correta. A reunião dessas diversas áreas de conhecimento no campo de Big
Data e mineração de dados faz com que essa seja uma disciplina multidisciplinar - uma
vez que abrange conceitos de vários campos diferentes - e também interdisciplinar - uma
vez que relaciona e interliga esses conceitos.
1 em 1 pontos

Outros materiais