Buscar

N2-DATA_MINING_Elson Gomes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Usuário
	ELSON GOMES CHIQUINI
	Curso
	POS0557 DATA MINING PG0377211 - 202112.ead-15434.01
	Teste
	Teste Final (N2)
	Iniciado
	23/02/21 08:35
	Enviado
	23/02/21 08:48
	Status
	Completada
	Resultado da tentativa
	10 em 10 pontos  
	Tempo decorrido
	13 minutos
	Resultados exibidos
	Respostas enviadas, Respostas corretas, Comentários
· Pergunta 1
· 1 em 1 pontos
	
	
	
	Leia o excerto a seguir:
 
"Os algoritmos de aprendizagem de máquina são ferramentas poderosas para a descoberta de conhecimentos em bases de dados. Entretanto, uma etapa inicial do processo de mineração que não requer elevado nível de sofisticação é a análise descritiva dos dados, ou seja, o uso de ferramentas capazes de medir, explorar e descrever características intrínsecas aos dados."
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 29.
 
Sobre os métodos usados em mineração de dados, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
 
I. Para identificar grupos de dados de acordo com um padrão específico, é usada a técnica de agrupamento ou clustering.
II. O mapeamento de um conjunto de dados com variáveis discretas é possível a partir da técnica de regressão.
III. A classificação é usada para mapear os valores discretos de um conjunto de dados.
IV. Regras de associação servem, unicamente, para identificar grupos de dados.
V. Deep learning , ou aprendizado de máquina, é um recurso usado  tanto em análises com aprendizado supervisionado quanto em análises de aprendizado não-supervisionado.
 
Assinale a alternativa que apresenta a sequência correta:
	Resposta Selecionada:
	 
V, F, V, F, V.
	Resposta Correta:
	 
V, F, V, F, V.
	Comentário da resposta:
	Resposta correta. As afirmações I, III e V são verdadeiras porque falam corretamente sobre a técnica de clusterização e os tipos de variáveis envolvidas, bem como do uso de treinamento supervisionado ou não-supervisionado pelo aprendizado de máquina; já as afirmações II e IV são falsas, pois e estimação usa variáveis contínuas (e não discretas), e porque as regras de associação servem para analisar a significância (e não para identificar grupos de dados, em si).
	
	
	
	
· Pergunta 2
· 1 em 1 pontos
	
	
	
	Leia o trecho a seguir sobre mineração de dados:
 
"Uma das famosas frases relacionadas a Big Data é: 'Big Data é o novo petróleo'. Podemos pensar que isso é uma analogia coerente, dado que, assim como o petróleo, o maior valor é obtido após um processo de refinamento, ou seja, após a transição de dados brutos para um determinado produto."
 
MARQUESONE, R. de F. P. Big Data: técnicas e tecnologias para extração de valor dos dados. São Paulo: Casa do Código, 2017, pág. 29.
 
Sobre o termo data mining, analise as asserções a seguir e a relação proposta entre elas:
 
I. O termo "mineração de dados" tem associação direta com a atividade de mineração de ouro, jazidas e pedras preciosas
PORQUE
II. encontrar os dados e a sua relação correta evoca informações que podem ser muito valiosas para as estratégias de uma empresa.
 
Assinale a alternativa correta.
	Resposta Selecionada:
	 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
	Resposta Correta:
	 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
	Comentário da resposta:
	Resposta correta. Empresas se beneficiam com a análise de dados justamente porque a mineração de dados leva à descoberta de novos padrões, informações e conhecimentos, o que permite não apenas alterar um processo interno da empresa, como também pode evidenciar um erro ou um padrão que não havia sido notado antes.
	
	
	
	
· Pergunta 3
· 1 em 1 pontos
	
	
	
	As etapas de mineração de dados de utilizam ferramentas, técnicas e algoritmos de algumas diferentes áreas do conhecimento para trabalhar com um conjunto de dados, a partir do qual serão extraídas as informações necessárias, conforme os objetivos de pesquisa ou de negócio. Sobre as áreas relacionadas à mineração de dados, associe os itens a seguir aos seus correspondentes:
 
(1)  Big Data.
(2)  Inteligência Artificial.
(3)  Estatística.
 
(  ) Validação de dados.
(  ) Aprendizado de máquina.
(  ) Manipulação de dados.
 
Assinale a alternativa correta.
	Resposta Selecionada:
	 
3, 2, 1.
	Resposta Correta:
	 
3, 2, 1.
	Comentário da resposta:
	Resposta correta. Você realizou a associação correta entre 1. (Big Data - Manipulação de dados), 2. (Inteligência Artificial - Aprendizado de máquina) e 3. Estatística (Validação de dados). Isso porque, enquanto as tecnologias de banco de dados associadas ao Big Data evoluíram para acomodar grandes volumes a maiores taxas de processamento, a Estatística funciona para avaliar resultados e validá-los, e o aprendizado de máquina só é possível por conta dos estudos de inteligência artificial.
	
	
	
	
· Pergunta 4
· 1 em 1 pontos
	
	
	
	Dentre as possíveis metodologias existentes para proceder à análise de dados, o CRISP-DM ( Cross-Industry Standard Process of Data Mining , ou Processo Industrial Padrão de Mineração de Dados) é um método que diz respeito a um processo de fluxo unidirecional composto por ciclos ou etapas, assim como o método KDD.
 
Sobre CRISP-DM, assinale a alternativa correta:
	Resposta Selecionada:
	 
Envolve preparação, implantação, pesquisa, modelagem e avaliação de dados.
	Resposta Correta:
	 
Envolve preparação, implantação, pesquisa, modelagem e avaliação de dados.
	Comentário da resposta:
	Resposta correta. o CRISP-DM possui diversas etapas, assim como o método KDD, contudo essas fases, embora tenham um fluxo unidirecional, possuem etapas cíclicas, ou seja, que permitem ir e voltar entre si. Por exemplo, a fase de entendimento e pesquisa de dados pode se alternar com a de implantação e preparação de dados, uma vez que se tenha localizado uma inconsistência no momento da implantação que traga a exigência de uma nova pesquisa ou de um novo entendimento sobre o dado com erro.
	
	
	
	
· Pergunta 5
· 1 em 1 pontos
	
	
	
	Sobre análise descritiva de dados, leia o parágrafo a seguir:
 
"As análises descritivas permitem uma sumarização e compreensão dos objetos da base e seus atributos, como qual o salário médio dos professores universitários brasileiros ou qual a distribuição salarial desses professores.”
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 29.
 
Com base nisso, avalie as asserções a seguir e a relação proposta entre elas:
 
I. A partir da análise descritiva de dados, é possível prever o maior período de vendas de um e-commerce
PORQUE,
II. havendo uma base de dados com informações sobre os períodos de venda anteriores, há como verificar a existência de padrões a partir da mineração de dados.
 
Assinale a alternativa correta:
	Resposta Selecionada:
	 
A asserção II é uma proposição verdadeira e a asserção I é uma proposição falsa.
	Resposta Correta:
	 
A asserção II é uma proposição verdadeira e a asserção I é uma proposição falsa.
	Comentário da resposta:
	Resposta correta. A análise descritiva de dados é usada junto à estatística exploratória, ou seja, usa medidas de centro e de variação para analisar frequências, probabilidades e compreender melhor os padrões de um conjunto de dados. Usa-se, para isso, da média, da moda e da mediana, além de medidas de dispersão para encontrar a Amplitude, a Variância e o Desvio Padrão. Assim sendo, a asserção II é verdadeira e justifica a asserção I, contudo a asserção I é falsa, pois não é a análise descritiva de dados que usamos para prever tendências, e sim a análise preditiva.
	
	
	
	
· Pergunta 6
· 1 em 1 pontos
	
	
	
	Sobre tomada de decisão estratégica, Provost e Fawcett explicam que a sigla DDD refere-se a Data-Driven Decision-making, ou seja, tomada de decisão com base nos dados, e consiste na prática de usar a análisede dados como suporte ao posicionamento estratégico em vez da gestão baseada na intuição pura.
 
PROVOST, F.; FAWCETT, T. Data Science for Business: What you need to know about data mining and data-analytic thinking. Califórnia: O'Reilly, 2013.
 
Pensando nisso, assinale a alternativa que reflete a prática de DDD:
	Resposta Selecionada:
	 
Usa a análise de dados para promover decisões mais assertivas.
	Resposta Correta:
	 
Usa a análise de dados para promover decisões mais assertivas.
	Comentário da resposta:
	Resposta correta. Uma vez que o gestor esteja com o resultado da análise de dados em mãos, ele consegue perceber detalhes que antes eram imperceptíveis, como um padrão ou uma tendência em relação a um tipo de serviço e/ou produto. A análise permite ao gestor, assim, pensar na melhor estratégia com base em fatores reais, e não somente em sua experiência e intuição como gestor.
	
	
	
	
· Pergunta 7
· 1 em 1 pontos
	
	
	
	Em Ciência de Dados, há basicamente dois formatos de análise possível, em que a análise de dados pode recorrer tanto a procedimentos estatísticos quanto a algoritmos de aprendizado de máquina (ou análise preditiva) para descobrir padrões e extrair conhecimento de uma base de dados.
 
A partir do exposto, associe as técnicas de análise dados a seguir às suas possíveis associações:
 
(1)  Análise exploratória.
(2)  Análise de estimação.
(3)  Análise de classificação.
 
(  ) Regressão estatística.
(  ) Cálculo do desvio padrão.
(  ) Predição de valores discretos.
 
Agora indique a ordenação correta entre os tipos de análise e seus respectivos métodos:
	Resposta Selecionada:
	 
 2, 1, 3.
	Resposta Correta:
	 
 2, 1, 3.
	Comentário da resposta:
	Resposta correta. Você associou corretamente as colunas 2. ( Análise de estimação ) Regressão estatística, 1. ( Análise exploratória ) Cálculo do desvio padrão e 3. ( Análise de classificação ) Predição de valores discretos. As análises de estimação e de classificação fazem parte do campo da Predição, sendo que a primeira lida com valores discretos e, a segunda, com valores contínuos; já a análise preditiva ou exploratória usa conceitos básicos da estatística, como as medidas centrais e de dispersão, para investigar as variáveis, sendo o Desvio Padrão associado à medida de Variância.
	
	
	
	
· Pergunta 8
· 1 em 1 pontos
	
	
	
	Sobre agrupamento, leia o parágrafo a seguir:
 
"Em um processo de agrupamento, os objetos são agrupados com o objetivo de maximizar a distância interclasse e minimizar a distância intraclasse, ou, dito de outra forma, maximizar a similaridade intraclasse e minimizar a similaridade interclasse."
 
CASTRO, L. N. de; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016, pág. 30.
 
O processo de agrupamento ou clusterização é uma das técnicas utilizadas em mineração de dados. Esse processo faz parte da análise preditiva, que inclui classificação, regressão e segmentação de dados. A respeito dessas técnicas, indique a alternativa que apresenta o método comumente aplicado:
	Resposta Selecionada:
	 
redes neurais.
	Resposta Correta:
	 
redes neurais.
	Comentário da resposta:
	Resposta correta. As redes neurais fazem parte do aprendizado de máquina, usado tanto para aprendizagem supervisionada quanto não-supervisionada, de modo que são aplicadas tanto em técnicas de classificação quanto em modelos de regressão e na segmentação de dados.
	
	
	
	
· Pergunta 9
· 1 em 1 pontos
	
	
	
	A mineração de dados é um processo relacionado às áreas de Ciência de Dados e Big Data responsável por integrar um processamento maior dentro da análise de dados, que consiste em diferentes etapas. Esse processo permite que os dados sejam extraídos e trabalhados a partir de um dataset.
 
Nesse sentido, assinale a alternativa que define a etapa imediatamente anterior à da mineração de dados.
	Resposta Selecionada:
	 
Transformar os dados conforme um padrão.
	Resposta Correta:
	 
Transformar os dados conforme um padrão.
	Comentário da resposta:
	Resposta correta. Após as etapas de seleção de de pré-processamento, será na fase da transformação dos dados que ocorrerá a conversão dos dados brutos em um formato padrão que seja possível de filtrar e utilizar para a análise estatística,, de forma que os dados estejam melhor relacionados entre si e que possam ser analisados posteriormente.
	
	
	
	
· Pergunta 10
· 1 em 1 pontos
	
	
	
	Na atualidade, os dados são gerados continuamente pelas mais diversas fontes. Ao acessar um site, por exemplo, uma única pessoa gera dados relacionados aos cliques e movimentos do mouse, às palavras que escreve na tela, aos termos que busca no Google e aos conteúdos pelos quais se interessa. Pensando nos milhões de usuários que acessam a internet 24h por dia, o volume de dados gerado a cada segundo é impressionante.
 
Com base nisso, assinale a alternativa correta.
	Resposta Selecionada:
	 
Big Data é a evolução das tecnologias e arquiteturas relacionadas às bases de dados.
	Resposta Correta:
	 
Big Data é a evolução das tecnologias e arquiteturas relacionadas às bases de dados.
	Comentário da resposta:
	Resposta correta. Não é à toa que um dos “5 Vs” de Big Data seja Velocidade. Para comportar grandes volumes de dados, as tecnologias envolvidas também precisaram melhorar em termos de processamento - só assim foi possível acompanhar e dar suporte à entrada contínua de dados na rede.

Outros materiais