Baixe o app para aproveitar ainda mais
Prévia do material em texto
27/05/2021 Atividade Objetiva 3: Mineração de Dados https://famonline.instructure.com/courses/12584/quizzes/42562 1/9 Atividade Objetiva 3 Entrega 2 jun em 23:59 Pontos 1 Perguntas 5 Disponível 10 fev em 0:00 - 2 jun em 23:59 4 meses Limite de tempo Nenhum Tentativas permitidas 2 Instruções Histórico de tentativas Tentativa Tempo Pontuação MAIS RECENTE Tentativa 1 15 minutos 1 de 1 Pontuação desta tentativa: 1 de 1 Enviado 27 mai em 23:09 Esta tentativa levou 15 minutos. Importante: Caso você esteja realizando a atividade através do aplicativo "Canvas Student", é necessário que você clique em "FAZER O QUESTIONÁRIO", no final da página. Fazer o teste novamente 0,2 / 0,2 ptsPergunta 1 Leia o texto a seguir: “Dados se constituem como a matéria prima para que processos de mineração ocorram. [...] A forma como os dados estão disponíveis para a realização da mineração é importante para determinar o tipo de tarefa de mineração que é possível resolver, o tipo de conhecimento factível de ser descoberto e o tipo de técnica de mineração aplicável.” Fonte: DA SILVA, L. A.; PERES, S. M.; BOSCARIOLI, C. Introdução à Mineração de Dados Com aplicações em R. Rio de Janeiro: https://famonline.instructure.com/courses/12584/quizzes/42562/history?version=1 https://famonline.instructure.com/courses/12584/quizzes/42562/take?user_id=31371 27/05/2021 Atividade Objetiva 3: Mineração de Dados https://famonline.instructure.com/courses/12584/quizzes/42562 2/9 Elsevier, 2016. p. 7. Considerando as características dos dados utilizados pelas tarefas de mineração, avalie as afirmações e selecione a alternativa correta. I. Os dados estruturados apresentam uma semântica, ou seja, um significado associado à sua estrutura, são exemplos de dados estruturados os e-mails e as mensagens de texto. II. Os dados não estruturados, que correspondem à maioria dos dados disponíveis, são mais facilmente analisados pelos algoritmos, esse tipo de dado não apresenta uma semântica evidente. III. Dados rotulados são aqueles que apresentam uma classe explícita e os demais atributos são preditivos ou de entrada, a tarefa de classificação considera esse tipo de dado. IV. Dados não rotulados apresentam somente atributos preditivos, não descrevendo explicitamente a qual classe os registros pertencem, a tarefa de agrupamento considera esse tipo de dado. É correto o que se afirma apenas em: II e IV, apenas. I e II, apenas. I e III, apenas. II e III, apenas. III e IV, apenas. Correto!Correto! 27/05/2021 Atividade Objetiva 3: Mineração de Dados https://famonline.instructure.com/courses/12584/quizzes/42562 3/9 A alternativa está correta, pois apenas as afirmações III e IV são verdadeiras. A afirmativa III está correta, pois dizemos que um conjunto de dados é rotulado quando, para cada registro, existe um atributo específico que define sua classe e, esse tipo de dado, é utilizado, comumente, nas tarefas de classificação. A afirmativa IV está correta, um dado é não rotulado quando não há uma definição explícita de pertinência à uma classe, assim, não é possível obter modelos preditivos e consideramos os atributos presentes para a definição de agrupamentos. A afirmativa I está incorreta, pois e-mails e mensagens de texto são dados não estruturados. A afirmativa II está incorreta, pois os dados não estruturados são mais facilmente analisados por seres humanos. 0,2 / 0,2 ptsPergunta 2 Leia o texto a seguir: “Na resolução da tarefa de classificação de dados, o objetivo é predizer o rótulo para um exemplar qualquer que não pertence ao conjunto de dados de treinamento. Portanto, o uso de um modelo preditivo f promove a atribuição de um rótulo y a um exemplar x qualquer, ou seja, y = f(x), sendo y uma variável do tipo categórico. Por outro lado, quando y é do tipo numérico (contínuo ou discreto), diz-se ter um problema de regressão ou predição numérica.” Fonte: DA SILVA, L. A.; PERES, S. M.; BOSCARIOLI, C. Introdução à Mineração de Dados Com aplicações em R. Rio de Janeiro: Elsevier, 2016. p. 117. Considerando as descrições apresentadas, assinale a opção correta. 27/05/2021 Atividade Objetiva 3: Mineração de Dados https://famonline.instructure.com/courses/12584/quizzes/42562 4/9 A tarefa de regressão, também, considera um conjunto de dados de treinamento e um conjunto de dados de teste. O primeiro é utilizado para aferir a capacidade preditiva do modelo, enquanto o segundo é utilizado para aprender a função. Existem diferentes técnicas que podem ser utilizadas para a tarefa de regressão, além da regressão linear. Dentre as diferentes técnicas podemos destacar as árvores de decisão e os algoritmos de agrupamento. A regressão é uma tarefa preditiva, assim como a classificação, e tem o objetivo de aprender uma função que seja efetiva para mapear um novo registro cujo atributo dependente seja ausente. Correto!Correto! Esta alternativa está correta, pois o objetivo da tarefa de regressão é predizer um valor real, representado por um atributo alvo, de modo que novos registros possam ser qualificados a partir dos atributos preditivos. A diferença entre as tarefas de classificação e de regressão é que a primeira busca inferir uma classe, ou seja, um valor contínuo. Por outro lado, a regressão busca inferir um valor discreto para um determinado atributo. A tarefa de regressão pode ser feita a partir do aprendizado de uma função linear, que é feito a partir da análise da distribuição das amostras rotuladas, assim denominamos esta tarefa de regressão polinomial. 0,2 / 0,2 ptsPergunta 3 Leia o texto a seguir: 27/05/2021 Atividade Objetiva 3: Mineração de Dados https://famonline.instructure.com/courses/12584/quizzes/42562 5/9 “Para que seja feita a mineração de regras de associação, as bases de dados transacionais normalmente são representadas seguindo o mesmo padrão das bases de dados convencionais, ou seja, com os objetos nas linhas e os atributos nas colunas. A diferença é que os atributos das bases transacionais são os itens que aparecem nas transações, o que faz com que tais bases de dados facilmente apresentem alta dimensionalidade, da ordem de centenas e até milhares de itens. ” Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: Saraiva, 2016. p. 235. Considerando as informações apresentadas, avalie as seguintes asserções e a relação proposta entre elas. I. A mineração de regras de associação é uma tarefa que tem por objetivo identificar padrões de associação entre itens frequentes que são pertinentes a um conjunto de transações. PORQUE II. As bases de dados transacionais disponibilizam registros referentes a grupos de itens que estão associados, ou seja, pertencem a mesma transação. A respeito dessas asserções, assinale a opção correta: As asserções I e II são ambas proposições falsas. As asserções I e II são proposições verdadeiras, e a II é uma justificativa da I. Correto!Correto! 27/05/2021 Atividade Objetiva 3: Mineração de Dados https://famonline.instructure.com/courses/12584/quizzes/42562 6/9 Alternativa está correta, pois as asserções I e II são proposições verdadeiras, e a II é uma justificativa da I. A asserção I é verdadeira, pois descreve corretamente o objetivo da mineração de regras de associação. A asserção II é verdadeira, pois descreve corretamente as características das bases de dados transacionais. A asserção II é uma justificativa da asserção I, pois a característica desse tipo de base de dados é importante para a definição da tarefa. A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa da I. A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. 0,2 / 0,2 ptsPergunta 4 Leia o texto a seguir: “Uma das habilidades mais básicas dos organismos vivos é a capacidade de agrupar objetos similarespara produzir uma taxonomia, uma classificação ou um agrupamento. A ideia de organizar coisas similares em categorias, chamadas aqui de grupos (clusters), é bastante antiga e reflete a capacidade de identificar características ou combinações de características similares em alguns objetos, como forma, cor, cheiro, posição, altura, peso, entre outras. ” Fonte: CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. São Paulo: 27/05/2021 Atividade Objetiva 3: Mineração de Dados https://famonline.instructure.com/courses/12584/quizzes/42562 7/9 Saraiva, 2016. p. 88. Considere as seguintes descrições a respeito das etapas que descrevem o processo de agrupamento. I. A etapa de seleção de atributos considera o contexto da análise para identificar os melhores conjuntos de dados que devem ser de variadas fontes e de grade volume e complexidade. II. A etapa da definição da medida de similaridade avalia a contribuição de cada atributo para o cálculo da medida e a normalização dos dados para não haver atributo dominante. III. A etapa de seleção do critério de agrupamento define a sensibilidade do agrupamento de acordo com a quantidade de atributos e de registros disponíveis. IV. A etapa de validação e de interpretação dos resultados considera a realização de testes para verificação da correção e da relevância dos resultados obtidos. É correto o que se afirma apenas em: I e III, apenas. II e III, apenas. I e II, apenas. I e IV, apenas. II e IV, apenas. Correto!Correto! 27/05/2021 Atividade Objetiva 3: Mineração de Dados https://famonline.instructure.com/courses/12584/quizzes/42562 8/9 A alternativa está correta, pois apenas as afirmações II e IV são verdadeiras. A afirmação II é verdadeira, pois nesta etapa é verificado como as medidas são impactadas pela escolha de determinados atributos, sendo que diferentes escolhas produzem impacto nas medidas e o processo de normalização dos dados tem por objetivo uniformizar as diferentes escalas dos dados, de modo a não permitir que haja discrepância entre as escalas. A afirmação IV é verdadeira, pois os resultados obtidos devem ser avaliados quanto à correção que eles apresentam e o impacto correspondente que pode ser obtido por meio da aplicação da solução em novos contextos. A afirmação I é falsa, pois a etapa de seleção de atributos considera o contexto da análise para identificar os melhores atributos, a quantidade de informação codificada por eles e a redundância entre eles. A afirmação III é falsa, pois a etapa de seleção do critério de agrupamento define a sensibilidade do agrupamento de acordo com o tipo de grupo que se espera obter. 0,2 / 0,2 ptsPergunta 5 Leia o texto abaixo: “[...] denomina-se classificação o processo pelo qual se determina um mapeamento capaz de indicar a qual classe pertence qualquer exemplar de um domínio sob análise, com base em um conjunto de dados já classificado.” Fonte: DA SILVA, L. A.; PERES, S. M.; BOSCARIOLI, C. Introdução à Mineração de Dados Com aplicações em R. Rio de Janeiro: Elsevier, 2016. p. 79. Qual alternativa caracteriza, corretamente, a tarefa de classificação? 27/05/2021 Atividade Objetiva 3: Mineração de Dados https://famonline.instructure.com/courses/12584/quizzes/42562 9/9 Trata-se de uma tarefa preditiva, de aprendizado supervisionado, cujo objetivo é aprender um modelo que seja útil para obter um valor contínuo de um novo registro. Trata-se de uma tarefa preditiva, de aprendizado não supervisionado, cujo objetivo é aprender um modelo que seja útil para obter um valor categórico de um novo registro. Trata-se de uma tarefa descritiva, de aprendizado supervisionado, cujo objetivo é aprender um modelo que seja útil para obter um valor contínuo de um novo registro. Trata-se de uma tarefa preditiva, de aprendizado supervisionado, cujo objetivo é aprender um modelo que seja útil para obter um valor categórico de um novo registro. Correto!Correto! Sua resposta está correta. A classificação é uma tarefa preditiva, ou seja, busca aprender um modelo para classificar novos registros. Essa é uma tarefa de aprendizado supervisionado, isto é, os dados de treinamento possuem rótulos. O objetivo da tarefa é obter um valor categórico, uma classe e não um valor contínuo, que é o objetivo da tarefa de regressão. Trata-se de uma tarefa descritiva, de aprendizado não supervisionado, cujo objetivo é aprender um modelo que seja útil para obter um valor categórico de um novo registro. Pontuação do teste: 1 de 1
Compartilhar