Buscar

Data Mining - UAM

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Leia o trecho a seguir:
 “É comum, ao ouvir pela primeira vez o termo Big Data, pensarmos que ele está unicamente relacionado a um grande volume de dados (o que é normal, já que o nome diz exatamente isso). Entretanto, o volume de dados não é sua única característica.”.
 MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 8.
 Esse trecho é uma introdução da autora aos termos que designam os “5 Vs” de Big Data, sendo um deles o volume, que costuma ser o mais associado a uma grande base de dados, por motivos óbvios. Entretanto, há outras características que devem ser consideradas. Nesse sentido, leia e relacione cada um dos termos dos “5 Vs” às suas características correspondentes:
 
(1) Volume.
(2) Velocidade.
(3) Veracidade.
(4) Variedade.
(5) Valor.
 
( ) Confiabilidade.
( ) Eventos estatísticos.
( ) Tipos de dados.
( ) Registros.
( ) Coleta de dados.
 
A partir das relações feitas anteriormente, assinale a alternativa que apresenta a sequência correta:
Resposta Correta:	
Correta 3, 5, 4, 1, 2.
Pergunta 2
A prática de análise de dados não é uma novidade para as empresas. Desde o tempo de arquivos em papel, era necessário ter uma equipe ou um especialista dedicado a organizar, filtrar e analisar as informações contidas nas bases de dados físicas. Para tanto, foi desenvolvido o método KDD, que consiste em um processo de descoberta de conhecimento dividido em várias etapas. Sobre as etapas de análise de dados pelo método KDD, avalie os itens a seguir:
 
I. Mineração de dados
II. Avaliação
III. Seleção
IV. Pré-processamento
V. Transformação
 
Agora assinale a alternativa que representa a ordem correta dessas etapas:
Resposta Correta:	
Correta IV, III, V, I, II.
Pergunta 3
Sobre bases de dados, leia o parágrafo a seguir:
 
“Atualmente, grande parcela dos dados gerados por humanos é oriunda de mídias sociais, onde usuários podem publicar o que pensam sobre algo, gerar debates, publicar suas preferências e suas emoções. Essas informações são geradas em formatos de texto, imagem, áudio e vídeo, resultando em uma base de dados diversificada e volumosa.”
 
MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 18.
 
Assinale a alternativa que representa o tipo de dado que estaria nessa base de dados diversificada e volumosa:
Resposta Correta:	
Correta Dados não-estruturados.
Pergunta 4
Sobre detecção de anomalias, leia o trecho a seguir:
 
"Uma base de dados pode conter objetos que não seguem o comportamento ou não possuem a característica comum dos dados ou de um modelo que os represente. Esses dados são conhecidos como anomalias ou valores discrepantes (outliers)."
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 31.
 
Sobre os outliers (ou pontos fora da curva), analise as asserções a seguir e a relação proposta entre elas:
 
I. Os outliers
são considerados ruídos e às vezes filtrados automaticamente pela ferramenta utilizada, mas, em alguns casos devem ser mantidos
PORQUE,
II. em uma análise que objetiva a detecção de fraude, por exemplo, as anomalias podem conter informações significativas.
 
Assinale a alternativa correta.
Resposta Correta:	
Correta As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
Pergunta 5
Leia o excerto a seguir:
 "Os algoritmos de aprendizagem de máquina são ferramentas poderosas para a descoberta de conhecimentos em bases de dados. Entretanto, uma etapa inicial do processo de mineração que não requer elevado nível de sofisticação é a análise descritiva dos dados, ou seja, o uso de ferramentas capazes de medir, explorar e descrever características intrínsecas aos dados."
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 29.
 
Sobre os métodos usados em mineração de dados, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
 
I. Para identificar grupos de dados de acordo com um padrão específico, é usada a técnica de agrupamento ou clustering.
II. O mapeamento de um conjunto de dados com variáveis discretas é possível a partir da técnica de regressão.
III. A classificação é usada para mapear os valores discretos de um conjunto de dados.
IV. Regras de associação servem, unicamente, para identificar grupos de dados.
V. Deep learning , ou aprendizado de máquina, é um recurso usado tanto em análises com aprendizado supervisionado quanto em análises de aprendizado não-supervisionado.
 
Assinale a alternativa que apresenta a sequência correta:
Resposta Correta:	
Correta V, F, V, F, V.
Pergunta 6
Em Ciência de Dados, há basicamente dois formatos de análise possível, em que a análise de dados pode recorrer tanto a procedimentos estatísticos quanto a algoritmos de aprendizado de máquina (ou análise preditiva) para descobrir padrões e extrair conhecimento de uma base de dados.
 
A partir do exposto, associe as técnicas de análise dados a seguir às suas possíveis associações:
 
(1) Análise exploratória.
(2) Análise de estimação.
(3) Análise de classificação.
 
( ) Regressão estatística.
( ) Cálculo do desvio padrão.
( ) Predição de valores discretos.
 
Agora indique a ordenação correta entre os tipos de análise e seus respectivos métodos:
Resposta Correta:	
Correta 2, 1, 3.
Pergunta 7
Dentre as possíveis metodologias existentes para proceder à análise de dados, o CRISP-DM ( Cross-Industry Standard Process of Data Mining , ou Processo Industrial Padrão de Mineração de Dados) é um método que diz respeito a um processo de fluxo unidirecional composto por ciclos ou etapas, assim como o método KDD.
 
Sobre CRISP-DM, assinale a alternativa correta:
Resposta Correta:	
Correta Envolve preparação, implantação, pesquisa, modelagem e avaliação de dados.
Pergunta 8
Leia o trecho a seguir:
 
"A mineração de dados envolve conhecimento de áreas como banco de dados, estatística, aprendizagem de máquina, computação de alto desempenho, reconhecimento de padrões, computação natural, visualização de dados, recuperação de informação, processamento de imagens e de sinais, análise espacial de dados, inteligência artificial, entre outras."
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 28.
 
Nesse sentido, há muitos conteúdos que se cruzam e que dão respaldo à mineração de dados, de modo que um bom cientista de dados ou analista de B.I. - Business Intelligence deve apresentar habilidades que vão desde a noção de mercado e negócios até estatística e programação. Com isso em mente, assinale a palavra que resume a condição desse campo de atuação de Big Data:
Resposta Correta:	
Correta Multidisciplinar e interdisciplinar.
Pergunta 9
Sobre as tecnologias relacionadas a mineração de dados e Big Data, leia o excerto a seguir:
 
"Pesquisadores consideram que estamos vivenciando o início de uma nova revolução industrial, na qual os dados passam a ser elementos chaves dessa mudança. Podemos concluir, portanto, que esse é o momento ideal para criarmos oportunidades a partir dos dados."
 
MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 8.
 
Com base nisso, analise as asserções a seguir e a relação proposta entre elas:
 
I. Big Data é uma área de inovações voltada ao processamento de grandes volumes de dados
PORQUE
II. as tecnologias e arquiteturas envolvidas permitem alta velocidade de coleta, novas descobertas e diversos processos de análise.
 
A seguir, assinale a alternativa correta.
Resposta Correta:	
Correta As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
Pergunta 10
Sobre análise descritiva de dados, leia o parágrafo a seguir:
 
"As análises descritivas permitemuma sumarização e compreensão dos objetos da base e seus atributos, como qual o salário médio dos professores universitários brasileiros ou qual a distribuição salarial desses professores.”
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 29.
 
Com base nisso, avalie as asserções a seguir e a relação proposta entre elas:
 
I. A partir da análise descritiva de dados, é possível prever o maior período de vendas de um e-commerce
PORQUE,
II. havendo uma base de dados com informações sobre os períodos de venda anteriores, há como verificar a existência de padrões a partir da mineração de dados.
 
Assinale a alternativa correta:
Resposta Correta:	
Correta A asserção II é uma proposição verdadeira e a asserção I é uma proposição falsa.

Outros materiais