Buscar

N2 - Data Mining Tentativa 2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

· Pergunta 1
1 em 1 pontos
	
	
	
	Sobre bases de dados, leia o parágrafo a seguir:
 
“Atualmente, grande parcela dos dados gerados por humanos é oriunda de mídias sociais, onde usuários podem publicar o que pensam sobre algo, gerar debates, publicar suas preferências e suas emoções. Essas informações são geradas em formatos de texto, imagem, áudio e vídeo, resultando em uma base de dados diversificada e volumosa.”
 
MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 18.
 
Assinale a alternativa que representa o tipo de dado que estaria nessa base de dados diversificada e volumosa:
	
	
	
	
		Resposta Selecionada:
	 
Dados não-estruturados.
	Resposta Correta:
	 
Dados não-estruturados.
	Comentário da resposta:
	Resposta correta. Nas mídias sociais e nas páginas web é possível encontrar diversos tipos de dados, como textos, imagens, vídeos, áudios e outros formatos. Essa mistura de dados em uma organização precária configuram os dados não-estruturados, que precisarão passar por tratamento antes de poderem ser minerados e analisados.
	
	
	
· Pergunta 2
1 em 1 pontos
	
	
	
	Leia o trecho a seguir:
 
"A mineração de dados envolve conhecimento de áreas como banco de dados, estatística, aprendizagem de máquina, computação de alto desempenho, reconhecimento de padrões, computação natural, visualização de dados, recuperação de informação, processamento de imagens e de sinais, análise espacial de dados, inteligência artificial, entre outras."
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 28.
 
Nesse sentido, há muitos conteúdos que se cruzam e que dão respaldo à mineração de dados, de modo que um bom cientista de dados ou analista de B.I. - Business Intelligence deve apresentar habilidades que vão desde a noção de mercado e negócios até estatística e programação. Com isso em mente, assinale a palavra que resume a condição desse campo de atuação de Big Data:
	
	
	
	
		Resposta Selecionada:
	 
Multidisciplinar e interdisciplinar.
	Resposta Correta:
	 
Multidisciplinar e interdisciplinar.
	Comentário da resposta:
	Resposta correta. A reunião dessas diversas áreas de conhecimento no campo de Big Data e mineração de dados faz com que essa seja uma disciplina multidisciplinar - uma vez que abrange conceitos de vários campos diferentes - e também interdisciplinar - uma vez que relaciona e interliga esses conceitos.
	
	
	
· Pergunta 3
1 em 1 pontos
	
	
	
	Sobre análise descritiva de dados, leia o parágrafo a seguir:
 
"As análises descritivas permitem uma sumarização e compreensão dos objetos da base e seus atributos, como qual o salário médio dos professores universitários brasileiros ou qual a distribuição salarial desses professores.”
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 29.
 
Com base nisso, avalie as asserções a seguir e a relação proposta entre elas:
 
I. A partir da análise descritiva de dados, é possível prever o maior período de vendas de um e-commerce
PORQUE,
II. havendo uma base de dados com informações sobre os períodos de venda anteriores, há como verificar a existência de padrões a partir da mineração de dados.
 
Assinale a alternativa correta:
	
	
	
	
		Resposta Selecionada:
	 
A asserção II é uma proposição verdadeira e a asserção I é uma proposição falsa.
	Resposta Correta:
	 
A asserção II é uma proposição verdadeira e a asserção I é uma proposição falsa.
	Comentário da resposta:
	Resposta correta. A análise descritiva de dados é usada junto à estatística exploratória, ou seja, usa medidas de centro e de variação para analisar frequências, probabilidades e compreender melhor os padrões de um conjunto de dados. Usa-se, para isso, da média, da moda e da mediana, além de medidas de dispersão para encontrar a Amplitude, a Variância e o Desvio Padrão. Assim sendo, a asserção II é verdadeira e justifica a asserção I, contudo a asserção I é falsa, pois não é a análise descritiva de dados que usamos para prever tendências, e sim a análise preditiva.
	
	
	
· Pergunta 4
1 em 1 pontos
	
	
	
	Leia o trecho a seguir sobre mineração de dados:
 
"Uma das famosas frases relacionadas a Big Data é: 'Big Data é o novo petróleo'. Podemos pensar que isso é uma analogia coerente, dado que, assim como o petróleo, o maior valor é obtido após um processo de refinamento, ou seja, após a transição de dados brutos para um determinado produto."
 
MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 29.
 
Sobre o termo data mining, analise as asserções a seguir e a relação proposta entre elas:
 
I. O termo "mineração de dados" tem associação direta com a atividade de mineração de ouro, jazidas e pedras preciosas
PORQUE
II. encontrar os dados e a sua relação correta evoca informações que podem ser muito valiosas para as estratégias de uma empresa.
 
Assinale a alternativa correta.
	
	
	
	
		Resposta Selecionada:
	 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
	Resposta Correta:
	 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
	Comentário da resposta:
	Resposta correta. Empresas se beneficiam com a análise de dados justamente porque a mineração de dados leva à descoberta de novos padrões, informações e conhecimentos, o que permite não apenas alterar um processo interno da empresa, como também pode evidenciar um erro ou um padrão que não havia sido notado antes.
	
	
	
· Pergunta 5
1 em 1 pontos
	
	
	
	Sobre detecção de anomalias, leia o trecho a seguir:
 
"Uma base de dados pode conter objetos que não seguem o comportamento ou não possuem a característica comum dos dados ou de um modelo que os represente. Esses dados são conhecidos como anomalias ou valores discrepantes (outliers)."
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 31.
 
Sobre os outliers (ou pontos fora da curva), analise as asserções a seguir e a relação proposta entre elas:
 
I. Os outliers
são considerados ruídos e às vezes filtrados automaticamente pela ferramenta utilizada, mas, em alguns casos devem ser mantidos
PORQUE,
II. em uma análise que objetiva a detecção de fraude, por exemplo, as anomalias podem conter informações significativas.
 
Assinale a alternativa correta.
	
	
	
	
		Resposta Selecionada:
	 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
	Resposta Correta:
	 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
	Comentário da resposta:
	Resposta correta. Sabendo que no caso de detecção de fraude o ponto fora da curva é justamente aquele que pode indicar uma atividade fora do comum, os outliers podem, de fato, serem considerados dados importantes e significativos, de modo que a asserção II é uma justificativa correta da asserção I.
	
	
	
· Pergunta 6
0 em 1 pontos
	
	
	
	As etapas de mineração de dados de utilizam ferramentas, técnicas e algoritmos de algumas diferentes áreas do conhecimento para trabalhar com um conjunto de dados, a partir do qual serão extraídas as informações necessárias, conforme os objetivos de pesquisa ou de negócio. Sobre as áreas relacionadas à mineração de dados, associe os itens a seguir aos seus correspondentes:
 
(1)  Big Data.
(2)  Inteligência Artificial.
(3)  Estatística.
 
(  ) Validação de dados.
(  ) Aprendizado de máquina.
(  ) Manipulação de dados.
 
Assinale a alternativa correta.
	
	
	
	
		Resposta Selecionada:
	 
2, 1, 3.
	Resposta Correta:
	 
3, 2, 1.
	Comentário da resposta:
	Sua resposta está incorreta. As técnicas de inteligência artificial são de especial serventia ao aprendizado de máquina, enquanto os Bancos de Dados (área de BigData) permitem armazenar e manipular uma vasta quantidade de dados, e a Estatística é utilizada na avaliação dos resultados e validação de dados. Assim sendo, a associação correta fica com a ordenação "3, 2, 1".
	
	
	
· Pergunta 7
1 em 1 pontos
	
	
	
	Sobre tomada de decisão estratégica, Provost e Fawcett explicam que a sigla DDD refere-se a Data-Driven Decision-making, ou seja, tomada de decisão com base nos dados, e consiste na prática de usar a análise de dados como suporte ao posicionamento estratégico em vez da gestão baseada na intuição pura.
 
PROVOST, F.; FAWCETT, T. Data Science for Business: What you need to know about data mining and data-analytic thinking. Califórnia: O'Reilly, 2013.
 
Pensando nisso, assinale a alternativa que reflete a prática de DDD:
	
	
	
	
		Resposta Selecionada:
	 
Usa a análise de dados para promover decisões mais assertivas.
	Resposta Correta:
	 
Usa a análise de dados para promover decisões mais assertivas.
	Comentário da resposta:
	Resposta correta. Uma vez que o gestor esteja com o resultado da análise de dados em mãos, ele consegue perceber detalhes que antes eram imperceptíveis, como um padrão ou uma tendência em relação a um tipo de serviço e/ou produto. A análise permite ao gestor, assim, pensar na melhor estratégia com base em fatores reais, e não somente em sua experiência e intuição como gestor.
	
	
	
· Pergunta 8
0 em 1 pontos
	
	
	
	Leia o excerto a seguir:
 
"Os algoritmos de aprendizagem de máquina são ferramentas poderosas para a descoberta de conhecimentos em bases de dados. Entretanto, uma etapa inicial do processo de mineração que não requer elevado nível de sofisticação é a análise descritiva dos dados, ou seja, o uso de ferramentas capazes de medir, explorar e descrever características intrínsecas aos dados."
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 29.
 
Sobre os métodos usados em mineração de dados, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
 
I. Para identificar grupos de dados de acordo com um padrão específico, é usada a técnica de agrupamento ou clustering.
II. O mapeamento de um conjunto de dados com variáveis discretas é possível a partir da técnica de regressão.
III. A classificação é usada para mapear os valores discretos de um conjunto de dados.
IV. Regras de associação servem, unicamente, para identificar grupos de dados.
V. Deep learning , ou aprendizado de máquina, é um recurso usado  tanto em análises com aprendizado supervisionado quanto em análises de aprendizado não-supervisionado.
 
Assinale a alternativa que apresenta a sequência correta:
	
	
	
	
		Resposta Selecionada:
	 
V, F, V, F, F.
	Resposta Correta:
	 
V, F, V, F, V.
	Comentário da resposta:
	Sua resposta está incorreta. A técnica de clusterização identifica grupos de dados a partir de aprendizado supervisionado, em que a máquina é treinada para localizar ou repetir um padrão a partir de um parâmetro predefinido, trabalhando, assim, com variáveis discretas, então as alternativas I e III são verdadeiras; já o mapeamento de dados pela regressão ou estimação usa variáveis contínuas, motivo pelo qual a alternativa II é falsa; as regras de associação servem, principalmente, para analisar a significância entre diferentes conjuntos de dados, e não para simplesmente identificar os dados, motivo pelo qual a alternativa IV também é falsa. E o aprendizado de máquina pode ser do tipo supervisionado, quando inserimos informações conhecidas, ou não-supervisionado, quando o sistema deverá trabalhar com dados desconhecidos - portanto a afirmação V é verdadeira.
	
	
	
· Pergunta 9
0 em 1 pontos
	
	
	
	A prática de análise de dados não é uma novidade para as empresas. Desde o tempo de arquivos em papel, era necessário ter uma equipe ou um especialista dedicado a organizar, filtrar e analisar as informações contidas nas bases de dados físicas. Para tanto, foi desenvolvido o método KDD, que consiste em um processo de descoberta de conhecimento dividido em várias etapas. Sobre as etapas de análise de dados pelo método KDD, avalie os itens a seguir:
 
I. Mineração de dados
II. Avaliação
III. Seleção
IV. Pré-processamento
V. Transformação
 
Agora assinale a alternativa que representa a ordem correta dessas etapas:
	
	
	
	
		Resposta Selecionada:
	 
IV, V, I, III, II.
	Resposta Correta:
	 
III, IV, V, I, II.
	Comentário da resposta:
	Sua resposta está incorreta. Quando consideramos todas as etapas de processamento em uma análise de dados, a mineração é apenas uma parte desse processo. Isso significa que, inicialmente, os dados devem ser coletados e selecionados, para em seguida serem pré-processados e transformados em dados estruturados, de modo a permitir a transformação estatística e a mineração dos dados - ou seja, a busca pelas informações que se deseja obter, e cujo resultado será avaliado ao final.
	
	
	
· Pergunta 10
1 em 1 pontos
	
	
	
	A mineração de dados é um processo relacionado às áreas de Ciência de Dados e Big Data responsável por integrar um processamento maior dentro da análise de dados, que consiste em diferentes etapas. Esse processo permite que os dados sejam extraídos e trabalhados a partir de um dataset.
 
Nesse sentido, assinale a alternativa que define a etapa imediatamente anterior à da mineração de dados.
	
	
	
	
		Resposta Selecionada:
	 
Transformar os dados conforme um padrão.
	Resposta Correta:
	 
Transformar os dados conforme um padrão.
	Comentário da resposta:
	Resposta correta. Após as etapas de seleção de de pré-processamento, será na fase da transformação dos dados que ocorrerá a conversão dos dados brutos em um formato padrão que seja possível de filtrar e utilizar para a análise estatística,, de forma que os dados estejam melhor relacionados entre si e que possam ser analisados posteriormente.

Outros materiais