Baixe o app para aproveitar ainda mais
Prévia do material em texto
Usuário EBERSON COSTA Curso GRA1433 MINERAÇÃO DE DADOS GR2164211 - 202110.ead- 8801.04 Teste ATIVIDADE 4 (A4) Iniciado 10/06/21 15:13 Enviado 11/06/21 18:42 Status Completada Resultado da tentativa 10 em 10 pontos Tempo decorrido 27 horas, 29 minutos Resultados exibidos Respostas enviadas, Respostas corretas, Comentários Pergunta 1 Bancos de dados de sistemas varejistas possuem insights escondidos que podem auxiliar na melhora no relacionamento com os clientes, e alavancar as receitas. Para que isso venha a ocorrer é importante que a mineração de dados seja coerente e muito precisa, por isso deve ser feito a prototipagem, validação do modelo e seu desenvolvimento final. Neste sentido, é correto afirmar que: Resposta Selecionada: No modelo Jacknife em N observações a predição dos dados é feita com base N - 1 comparando-se o valor da exclusão Resposta Correta: No modelo Jacknife em N observações a predição dos dados é feita com base N - 1 comparando-se o valor da exclusão Comentário da resposta: A resposta está correta pois, O modelo Jacknife, em N observações exclui-se 1 (uma) aleatoriamente. Faz-se a predição com base N - 1 e se compara com o valor conhecido da exclusão. Repete-se o processo enquanto que a distribuição de erros valida ou não o modelo. Pergunta 2 Leia o excerto a seguir: “Os algoritmos de agrupamento hierárquico podem ser aglomerativos ou divisivos. No agrupamento hierárquico aglomerativo, inicialmente cada documento pertence a um grupo e, em cada iteração, os pares de grupos mais próximos são unidos até se formar um único grupo.” REZENDE, S.O.;MARCACINI, R.M.;MOURA, M.F.; O uso da Mineração de Textos para Extração e Organização Não Supervisionada de Conhecimento. Revista de Sistemas de Informação da FSMA. ICMC-USP. 2011. p.12. Disponível em: < http://www.fsma.edu.br/si/edicao7/FSMA_SI_2011_1_Principal_3.pdf > Acesso em: 01 Jan. 2020. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. I. Um agrupamento hierárquico aglomerativo, ocorre quando os pares (documentos) formam um único grupo II. Tanto a hierarquia divisiva quanto aglomerativa resultam em uma árvore binária http://www.fsma.edu.br/si/edicao7/FSMA_SI_2011_1_Principal_3.pdf denominada dendrograma III. No agrupamento a junção é somente na iteração inicial sendo improcedente a mesma em outras iterações IV. Um dendrograma é formado quando um grupo com todos os documentos de dividem em grupos A seguir, assinale a alternativa correta: Resposta Selecionada I e II, apenas. Resposta Correta I e II, apenas. Comentário da Resposta A resposta está correta pois, ao ser aglomerativo, ocorre quando cada documento pertence a um grupo, e em cada junção os pares próximos se unem até que no fim formam um único grupo. Tanto o hierárquico divisivo quanto o aglomerativo resultam em uma árvore binária denominada Dendrograma. Pergunta 3 Leia o excerto a seguir: “O diferencial deste algoritmo[apriori] está na criação dos itemsets candidatos usando a propriedade anti-monotonicity que garante que, se um conjunto de itens não for frequente, então todos os seus super conjuntos também não são frequentes. Assim, o algoritmo aumenta seu desempenho, já que não perde tempo varrendo e analisando esses super conjuntos. ” CASTRO, R.F.V.; Análise de desempenho dos algoritmos Apriori e Fuzzy Apriori na extração de regras de associação aplicados a um Sistema de Detecção de Intrusos . Dissertação para Mestrado. UERJ: Rio de Janeiro. 2014 A partir do apresentado, analise as asserções a seguir e marque a opção correta. Resposta Selecionada Na análise realizada pelo algoritmo um elemento N só pode ser considerado frequente se todos os seu N-1 forem frequentes Resposta Correta Na análise realizada pelo algoritmo um elemento N só pode ser considerado frequente se todos os seu N-1 forem frequentes Comentário da Resposta Resposta correta. A resposta está correta pois, Seguindo o princípio da antimonotonicidade de suporte, dentro de um algoritmo APRIORI, um k-itemset somente pode ser considerado frequente se todos os seus (n-1)-itemsets forem frequentes também. Pergunta 4 A lógica FUZZY, tem suporte aos modos de raciocínio aproximados e não exatos aos elementos que compõem o conjunto. O algoritmo FUZZY APRIORI aplica-se extraindo atributos de valores quantitativos através de regras de associação com o intuito de reduzir o tempo computacional gasto. Levando em consideração a lógica do algoritmo é correto afirmar que: Resposta Selecionada Os itemsets frequentes são baseados no nível de suporte mínimo e do valor de confiança mínimo. Resposta Correta Os itemsets frequentes são baseados no nível de suporte mínimo e do valor de confiança mínimo. Comentário da Resposta A resposta está correta pois, na lógica FUZZY APRIORI, que é uma teoria matemática que permite a modelagem próximo a habilidade humana na tomada de decisão, encontra-se os itemsets frequentes baseado no valor de suporte mínimo, e através do valor mínimo de confiança, extraídos das regras de associação. Pergunta 5 Ao ser realizado o agrupamento dos documentos que formarão a base de conhecimento a ser analisado, deverão ser definidos os descritores que irão auxiliar na interpretação dos resultados. O principal objetivo da tarefa é agir de forma exṕloratória. De acordo com a formação dos descritores é correto afirmar que: Resposta Selecionada Ao selecionar N documentos próximos a raiz, a seleção dos atributos deve ser realizada por aprendizado de máquina. Resposta Correta Ao selecionar N documentos próximos a raiz, a seleção dos atributos deve ser realizada por aprendizado de máquina. Comentário da Resposta A resposta está correta pois, ao selecionar os termos de N documentos que se encontram mais próximos à raiz, então através de técnicas específicas, selecionar atributos em tarefas de aprendizado de máquina os quais se aplicam aos descritores por agrupamento. Pergunta 6 Leia o excerto a seguir: ”A análise de agrupamentos tem como objetivo descobrir a estrutura (ou classes) de um determinado conjunto de dados não rotulados, onde cada objeto é descrito por P variáveis. Perguntas freqüentes incluem: (1) Existem subgrupos menos heterogêneos nos dados?; (2) Quantos subgrupos de fato existem (se é que existem)?; (3) Que objetos fazem parte de cada subgrupo?; (4) Uma vez encontrado um modelo para a estrutura dos dados, poderíamos gerar regras de decisão que possibilitaram a classificação de novas amostras?; Como tratar tipos de variáveis diferentes? ” Conforme a afirmativa acima é correto declarar com referência às técnicas de agrupamento que: COSTA, J.A.F.; Segmentação do SOM por Métodos de Agrupamentos Hierárquicos com Conectividade Restrita . Departamento de Engenharia Elétrica. UFRN: Natal. CBRN (Congresso Brasileiro de Redes Neurais) - 2005. P.2. Disponível em: < https://pdfs.semanticscholar.org/b7e8/c79c8caae597cd167cdb0c409943dfad5f28.pdf > Acesso em: 01 Jan. 2020. Resposta Selecionada Complete Linkage é uma técnica onde a ligação entre os elementos ocorre com os vizinhos mais distantes. Resposta Correta Complete Linkage é uma técnica onde a ligação entre os elementos ocorre com os vizinhos mais distantes. https://pdfs.semanticscholar.org/b7e8/c79c8caae597cd167cdb0c409943dfad5f28.pdf Comentário da Resposta A resposta está correta pois, A técnica é utilizada abordando o vizinho mais distante (Farthest Neighbor). De forma inversa ao single-linkage que é determinada a distância entre dois grupos pela maior distância entre o par de elementos, desde que pertençam a grupos distintos Pergunta 7 Leia o excerto a seguir: “Frequentemente, os dados são encontrados com diversas inconsistências: registros incompletos, valores errados e dados inconsistentes. A etapa de limpeza dos dadosvisa eliminar estes problemas de modo que eles não influem no resultado dos algoritmos usados. As técnicas usadas nesta etapa vão desde a remoção do registro com problemas, passando pela atribuição de valores padrões, até a aplicação de técnicas de agrupamento para auxiliar na descoberta dos melhores valores” CAMILO, C.O.; SILVA, J.C.; Mineração de Dados: Conceitos, Tarefas, Métodos e Ferramentas . Instituto de Informática da UFG: Goiás. 2009. p.6. Disponível em: < http://www.portal.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001- 09.pdf > acesso em: 05 Jan. 2020. Com base na citação proposta é correto afirmar que referente na execução da validação dos dados em um modelo: Resposta Selecionada Caso o problema encontrado seja na classificação dos dados, na regressão, o modelo precisa ser avaliado com diferentes amostras Resposta Correta Caso o problema encontrado seja na classificação dos dados, na regressão, o modelo precisa ser avaliado com diferentes amostras Comentário da Resposta A resposta está correta pois, ao conseguir encontrar os erros e o porquê dos mesmo é necessário se fazer a validação. Caso o problema seja basicamente na classificação dos dados, na regressão, o modelo precisa ser estimado levando em consideração diferentes amostras. Pergunta 8 Leia o excerto a seguir: “O algoritmo APRIORI basicamente se divide em duas etapas que são: I) Encontrar todos os conjuntos de itens frequentes (que satisfazem à condição de suporte mínimo). II) A partir do conjunto de itens frequentes, gerar as regras de associação (que satisfazem à condição de confiança mínima).” GOLDSCHMIDT, R.; PASSOS, E. Data Mining: um guia prático . Elsevier Editora Ltda:São Paulo, 2005. p.106 A partir do apresentado, analise as alternativas a seguir e marque a opção correta: Resposta Selecionada Os itens candidatos são definidos após a aceitação do suporte mínimo e o nível de confiança aceitável. Resposta Correta Os itens candidatos são definidos após a aceitação do suporte mínimo e o nível de confiança aceitável. Comentário da Resposta A resposta está correta pois, inicialmente ao definir a utilização da técnica, deve ser definido os valores de suporte e confiança mínimas http://www.portal.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf http://www.portal.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf utilizadas pelo algoritmo apriori para traçar as regras condizentes que definirão os itens candidatos. Pergunta 9 Leia o excerto a seguir: “O dendrograma é um diagrama de árvore que exibe os grupos formados por agrupamento de observações em cada passo e em seus níveis de similaridade. O nível de similaridade é medido ao longo do eixo vertical (alternativamente, você pode exibir o nível de distância) e as diferentes observações são listadas ao longo do eixo horizontal.” DENDROGRAMA. Suporte ao minitab18, 2019. Disponível em: <encurtador.com.br/bjuGT> Acesso em: 01 Jan. 2020. A partir do apresentado, assinale a alternativa correta. Resposta Selecionada Quanto maior a distância entre os elementos do gráfico melhor se torna a distribuição entre os grupos. Resposta Correta Quanto maior a distância entre os elementos do gráfico melhor se torna a distribuição entre os grupos. Comentário da Resposta A resposta está correta pois, a distância entre os grupos formados pelos atributos da base de dados, também é algo importante a ser considerado, pois quanto maior a distância melhor é a relação interna dos elementos de cada grupo, e melhor é a distinção dos grupos. Pergunta 10 Um modelo que deverá ser utilizado na mineração de dados corresponde ao processamento das informações de entradas que submetidas a determinadas condições e algoritmos devem retornar aquilo que foi definido como regras pelos analistas de negócio. Para que esse resultado seja conforme o esperado, protótipos que realizam testes exaustivos devem ser realizados. Em se tratando desses protótipos é correto afirmar que: Resposta Selecionada Dois tipos de modelos podem ser desenvolvidos, o preditivo e o descritivo, ambos com o propósito de analisar conceitos temporais Resposta Correta Dois tipos de modelos podem ser desenvolvidos, o preditivo e o descritivo, ambos com o propósito de analisar conceitos temporais Comentário da Resposta Resposta correta. A resposta está correta pois, o modelo preditivo consiste em prever futuros cenários baseado na análise de padrões que auxiliam em tomadas de decisão mais precisas, e o descritivo permite ao analista compreender os eventos em tempo real, não emite julgamento no valor, mas o impacto passado e futuro. Sexta-feira, 11 de Junho de 2021 20h22min25s BRT
Compartilhar