Buscar

N2 - Data Mining Tentativa 1

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

· Pergunta 1
1 em 1 pontos
	
	
	
	Sobre as tecnologias relacionadas a mineração de dados e Big Data, leia o excerto a seguir:
 
"Pesquisadores consideram que estamos vivenciando o início de uma nova revolução industrial, na qual os dados passam a ser elementos chaves dessa mudança. Podemos concluir, portanto, que esse é o momento ideal para criarmos oportunidades a partir dos dados."
 
MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 8.
 
Com base nisso, analise as asserções a seguir e a relação proposta entre elas:
 
I. Big Data é uma área de inovações voltada ao processamento de grandes volumes de dados
PORQUE
II. as tecnologias e arquiteturas envolvidas permitem alta velocidade de coleta, novas descobertas e diversos processos de análise.
 
A seguir, assinale a alternativa correta.
	
	
	
	
		Resposta Selecionada:
	 
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
	Resposta Correta:
	 
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
	Comentário da resposta:
	Resposta correta. Embora as suas afirmações sejam verdadeiras, o que é afirmado na asserção II não justifica o que foi exposto na I. Isso porque as tecnologias e arquiteturas relacionadas ao Big Data são o meio que permite que os bancos de dados funcionem e suportem o processamento ao grande volume de dados, mas essas tecnologias não promoveram a revolução do Big Data, em si - elas apenas evoluíram de modo a acompanhar essa tendência.
	
	
	
· Pergunta 2
1 em 1 pontos
	
	
	
	Leia o trecho a seguir:
 
“É comum, ao ouvir pela primeira vez o termo Big Data, pensarmos que ele está unicamente relacionado a um grande volume de dados (o que é normal, já que o nome diz exatamente isso). Entretanto, o volume de dados não é sua única característica.”.
 
MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 8.
 
Esse trecho é uma introdução da autora aos termos que designam os “5 Vs” de Big Data, sendo um deles o volume, que costuma ser o mais associado a uma grande base de dados, por motivos óbvios. Entretanto, há outras características que devem ser consideradas. Nesse sentido, leia e relacione cada um dos termos dos “5 Vs” às suas características correspondentes:
 
(1)  Volume.
(2)  Velocidade.
(3)  Veracidade.
(4)  Variedade.
(5)  Valor.
 
(  ) Confiabilidade.
(  ) Eventos estatísticos.
(  ) Tipos de dados.
(  ) Registros.
(  ) Coleta de dados.
 
A partir das relações feitas anteriormente, assinale a alternativa que apresenta a sequência correta:
	
	
	
	
		Resposta Selecionada:
	 
3, 5, 4, 1, 2.
	Resposta Correta:
	 
3, 5, 4, 1, 2.
	Comentário da resposta:
	Resposta correta. A confiabilidade está associada à integridade e Veracidade dos dados, sendo um dos “5 Vs”; o Valor está associado a eventos estatísticos, que permitem confirmar ou refutar uma hipótese, por exemplo; já os tipos de dados, que podem ser estruturados ou não estruturados, configuram a Variedade; e a Velocidade está relacionada a quão rapidamente os dados são coletados e posteriormente registrados em suas bases de dados; esses registros dizem respeito, assim, ao Volume.
	
	
	
· Pergunta 3
1 em 1 pontos
	
	
	
	Sobre agrupamento, leia o parágrafo a seguir:
 
"Em um processo de agrupamento, os objetos são agrupados com o objetivo de maximizar a distância interclasse e minimizar a distância intraclasse, ou, dito de outra forma, maximizar a similaridade intraclasse e minimizar a similaridade interclasse."
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 30.
 
O processo de agrupamento ou clusterização é uma das técnicas utilizadas em mineração de dados. Esse processo faz parte da análise preditiva, que inclui classificação, regressão e segmentação de dados. A respeito dessas técnicas, indique a alternativa que apresenta o método comumente aplicado:
	
	
	
	
		Resposta Selecionada:
	 
redes neurais.
	Resposta Correta:
	 
redes neurais.
	Comentário da resposta:
	Resposta correta. As redes neurais fazem parte do aprendizado de máquina, usado tanto para aprendizagem supervisionada quanto não-supervisionada, de modo que são aplicadas tanto em técnicas de classificação quanto em modelos de regressão e na segmentação de dados.
	
	
	
· Pergunta 4
1 em 1 pontos
	
	
	
	Sobre tomada de decisão estratégica, Provost e Fawcett explicam que a sigla DDD refere-se a Data-Driven Decision-making, ou seja, tomada de decisão com base nos dados, e consiste na prática de usar a análise de dados como suporte ao posicionamento estratégico em vez da gestão baseada na intuição pura.
 
PROVOST, F.; FAWCETT, T. Data Science for Business: What you need to know about data mining and data-analytic thinking. Califórnia: O'Reilly, 2013.
 
Pensando nisso, assinale a alternativa que reflete a prática de DDD:
	
	
	
	
		Resposta Selecionada:
	 
Usa a análise de dados para promover decisões mais assertivas.
	Resposta Correta:
	 
Usa a análise de dados para promover decisões mais assertivas.
	Comentário da resposta:
	Resposta correta. Uma vez que o gestor esteja com o resultado da análise de dados em mãos, ele consegue perceber detalhes que antes eram imperceptíveis, como um padrão ou uma tendência em relação a um tipo de serviço e/ou produto. A análise permite ao gestor, assim, pensar na melhor estratégia com base em fatores reais, e não somente em sua experiência e intuição como gestor.
	
	
	
· Pergunta 5
0 em 1 pontos
	
	
	
	Dentre as possíveis metodologias existentes para proceder à análise de dados, o CRISP-DM ( Cross-Industry Standard Process of Data Mining , ou Processo Industrial Padrão de Mineração de Dados) é um método que diz respeito a um processo de fluxo unidirecional composto por ciclos ou etapas, assim como o método KDD.
 
Sobre CRISP-DM, assinale a alternativa correta:
	
	
	
	
		Resposta Selecionada:
	 
É um software proprietário com ferramentas que facilitam a análise de dados.
	Resposta Correta:
	 
Envolve preparação, implantação, pesquisa, modelagem e avaliação de dados.
	Comentário da resposta:
	Sua resposta está incorreta.Sendo um método industrial, o CRISP-DM não diz respeito a um software, e sim a etapas que devem estar contidas no processo de análise de dados, de modo a permitir que os dados sejam sempre coletados, preparados, modelados e avaliados conforme um padrão, mantendo a qualidade.
	
	
	
· Pergunta 6
1 em 1 pontos
	
	
	
	Em Ciência de Dados, há basicamente dois formatos de análise possível, em que a análise de dados pode recorrer tanto a procedimentos estatísticos quanto a algoritmos de aprendizado de máquina (ou análise preditiva) para descobrir padrões e extrair conhecimento de uma base de dados.
 
A partir do exposto, associe as técnicas de análise dados a seguir às suas possíveis associações:
 
(1)  Análise exploratória.
(2)  Análise de estimação.
(3)  Análise de classificação.
 
(  ) Regressão estatística.
(  ) Cálculo do desvio padrão.
(  ) Predição de valores discretos.
 
Agora indique a ordenação correta entre os tipos de análise e seus respectivos métodos:
	
	
	
	
		Resposta Selecionada:
	 
 2, 1, 3.
	Resposta Correta:
	 
 2, 1, 3.
	Comentário da resposta:
	Resposta correta. Você associou corretamente as colunas 2. ( Análise de estimação ) Regressão estatística, 1. ( Análise exploratória ) Cálculo do desvio padrão e 3. ( Análise de classificação ) Predição de valores discretos. As análises de estimação e de classificação fazem parte do campo da Predição, sendo que a primeira lida com valores discretos e, a segunda, com valores contínuos; já a análise preditiva ou exploratória usa conceitos básicos da estatística, como as medidas centrais e de dispersão, para investigar as variáveis, sendo o Desvio Padrão associado à medida de Variância.
	
	
	
· Pergunta 7
1 em 1 pontos
	
	
	
	Sobrebases de dados, leia o parágrafo a seguir:
 
“Atualmente, grande parcela dos dados gerados por humanos é oriunda de mídias sociais, onde usuários podem publicar o que pensam sobre algo, gerar debates, publicar suas preferências e suas emoções. Essas informações são geradas em formatos de texto, imagem, áudio e vídeo, resultando em uma base de dados diversificada e volumosa.”
 
MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 18.
 
Assinale a alternativa que representa o tipo de dado que estaria nessa base de dados diversificada e volumosa:
	
	
	
	
		Resposta Selecionada:
	 
Dados não-estruturados.
	Resposta Correta:
	 
Dados não-estruturados.
	Comentário da resposta:
	Resposta correta. Nas mídias sociais e nas páginas web é possível encontrar diversos tipos de dados, como textos, imagens, vídeos, áudios e outros formatos. Essa mistura de dados em uma organização precária configuram os dados não-estruturados, que precisarão passar por tratamento antes de poderem ser minerados e analisados.
	
	
	
· Pergunta 8
1 em 1 pontos
	
	
	
	Sobre detecção de anomalias, leia o trecho a seguir:
 
"Uma base de dados pode conter objetos que não seguem o comportamento ou não possuem a característica comum dos dados ou de um modelo que os represente. Esses dados são conhecidos como anomalias ou valores discrepantes (outliers)."
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 31.
 
Sobre os outliers (ou pontos fora da curva), analise as asserções a seguir e a relação proposta entre elas:
 
I. Os outliers
são considerados ruídos e às vezes filtrados automaticamente pela ferramenta utilizada, mas, em alguns casos devem ser mantidos
PORQUE,
II. em uma análise que objetiva a detecção de fraude, por exemplo, as anomalias podem conter informações significativas.
 
Assinale a alternativa correta.
	
	
	
	
		Resposta Selecionada:
	 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
	Resposta Correta:
	 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
	Comentário da resposta:
	Resposta correta. Sabendo que no caso de detecção de fraude o ponto fora da curva é justamente aquele que pode indicar uma atividade fora do comum, os outliers podem, de fato, serem considerados dados importantes e significativos, de modo que a asserção II é uma justificativa correta da asserção I.
	
	
	
· Pergunta 9
0 em 1 pontos
	
	
	
	Leia o trecho a seguir:
 
“Após ter identificado o foco do projeto de Big Data e definido as respostas que deseja obter por meio de dados, você pode dar início à identificação de quais dados deverão ser capturados.”
 
MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 35.
 
Nesse trecho é afirmado que saber identificar o foco de um projeto de Big Data, ou seja, os objetivos da mineração de dados, é um passo fundamental para obter as respostas procuradas em um conjunto de dados. Sobre os objetivos do data mining , avalie e assinale a alternativa correta:
	
	
	
	
		Resposta Selecionada:
	 
Encontrar padrões nos dados visando o aprimoramento estatístico das hipóteses.
	Resposta Correta:
	 
Descobrir novas regras e padrões visando a aquisição de conhecimento indutivo.
	Comentário da resposta:
	Sua resposta está incorreta. A mineração de dados não visa o aprimoramento estatístico, nem confirma ou refuta hipóteses, nem segrega informações por si só - a mineração de dados serve para detectar padrões em uma base desconhecida ou que já tenha sido visitada, de modo a fornecer informações que serão transformadas em conhecimento após a análise final dos dados. Aplicar novas regras a informações anteriormente analisadas, embora possa ser objeto de um projeto de análise de dados, também não faz parte dos objetivos da etapa de mineração de dados, em si.
	
	
	
· Pergunta 10
0 em 1 pontos
	
	
	
	Sobre análise descritiva de dados, leia o parágrafo a seguir:
 
"As análises descritivas permitem uma sumarização e compreensão dos objetos da base e seus atributos, como qual o salário médio dos professores universitários brasileiros ou qual a distribuição salarial desses professores.”
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 29.
 
Com base nisso, avalie as asserções a seguir e a relação proposta entre elas:
 
I. A partir da análise descritiva de dados, é possível prever o maior período de vendas de um e-commerce
PORQUE,
II. havendo uma base de dados com informações sobre os períodos de venda anteriores, há como verificar a existência de padrões a partir da mineração de dados.
 
Assinale a alternativa correta:
	
	
	
	
		Resposta Selecionada:
	 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
	Resposta Correta:
	 
A asserção II é uma proposição verdadeira e a asserção I é uma proposição falsa.
	Comentário da resposta:
	Sua resposta está incorreta. Quando falamos em análise descritiva de dados, estamos falando em obter informações a partir da estatística exploratória, que usa as medidas centrais e de dispersão, por exemplo, para investigar frequências e probabilidades dentro de um conjunto de dados. Assim sendo, é a análise preditiva de dados que é utilizada para prever uma tendência e, embora a asserção II seja uma justificativa correta da I, a asserção I é falsa.

Continue navegando