Buscar

A4 NA MINERAÇÃO DE DADOS

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Usuário EBERSON COSTA 
Curso GRA1433 MINERAÇÃO DE DADOS GR2164211 - 202110.ead-
8801.04 
Teste ATIVIDADE 4 (A4) 
Iniciado 10/06/21 15:13 
Enviado 11/06/21 18:42 
Status Completada 
Resultado da 
tentativa 
10 em 10 pontos 
Tempo decorrido 27 horas, 29 minutos 
Resultados exibidos Respostas enviadas, Respostas corretas, Comentários 
 
 
Pergunta 1 
Bancos de dados de sistemas varejistas possuem insights escondidos que podem auxiliar 
na melhora no relacionamento com os clientes, e alavancar as receitas. Para que isso 
venha a ocorrer é importante que a mineração de dados seja coerente e muito precisa, 
por isso deve ser feito a prototipagem, validação do modelo e seu desenvolvimento final. 
 
Neste sentido, é correto afirmar que: 
 
Resposta 
Selecionada: 
No modelo Jacknife em N observações a predição dos dados é feita com 
base N - 1 comparando-se o valor da exclusão 
Resposta 
Correta: 
No modelo Jacknife em N observações a predição dos dados é feita com 
base N - 1 comparando-se o valor da exclusão 
Comentário da 
resposta: 
A resposta está correta pois, O modelo Jacknife, em N observações 
exclui-se 1 (uma) aleatoriamente. Faz-se a predição com base N - 1 e se 
compara com o valor conhecido da exclusão. Repete-se o processo 
enquanto que a distribuição de erros valida ou não o modelo. 
 
Pergunta 2 
Leia o excerto a seguir: 
“Os algoritmos de agrupamento hierárquico podem ser aglomerativos ou divisivos. 
No agrupamento hierárquico aglomerativo, inicialmente cada documento pertence a um 
grupo e, em cada iteração, os pares de grupos mais próximos são unidos até se formar 
um único grupo.” 
 
REZENDE, S.O.;MARCACINI, R.M.;MOURA, M.F.; O uso da Mineração de Textos para 
Extração e Organização Não Supervisionada de Conhecimento. Revista de Sistemas de 
Informação da FSMA. ICMC-USP. 2011. p.12. Disponível em: 
< http://www.fsma.edu.br/si/edicao7/FSMA_SI_2011_1_Principal_3.pdf > Acesso em: 01 
Jan. 2020. 
 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
 
I. Um agrupamento hierárquico aglomerativo, ocorre quando os pares (documentos) 
formam um único grupo 
II. Tanto a hierarquia divisiva quanto aglomerativa resultam em uma árvore binária 
http://www.fsma.edu.br/si/edicao7/FSMA_SI_2011_1_Principal_3.pdf
denominada dendrograma 
III. No agrupamento a junção é somente na iteração inicial sendo improcedente a mesma 
em outras iterações 
IV. Um dendrograma é formado quando um grupo com todos os documentos de dividem 
em grupos 
 
A seguir, assinale a alternativa correta: 
 
Resposta 
Selecionada 
I e II, apenas. 
Resposta 
Correta 
I e II, apenas. 
Comentário 
da Resposta 
A resposta está correta pois, ao ser aglomerativo, ocorre quando 
cada documento pertence a um grupo, e em cada junção os pares 
próximos se unem até que no fim formam um único grupo. Tanto o 
hierárquico divisivo quanto o aglomerativo resultam em uma árvore 
binária denominada Dendrograma. 
 
Pergunta 3 
Leia o excerto a seguir: 
 
 “O diferencial deste algoritmo[apriori] está na criação dos itemsets candidatos usando a 
propriedade anti-monotonicity que garante que, se um conjunto de itens não for 
frequente, então todos os seus super conjuntos também não são frequentes. Assim, o 
algoritmo aumenta seu desempenho, já que não perde tempo varrendo e analisando 
esses super conjuntos. ” 
 
CASTRO, R.F.V.; Análise de desempenho dos algoritmos Apriori e Fuzzy Apriori na 
extração de regras de associação aplicados a um Sistema de Detecção de 
Intrusos . Dissertação para Mestrado. UERJ: Rio de Janeiro. 2014 
 
A partir do apresentado, analise as asserções a seguir e marque a opção correta. 
 
Resposta 
Selecionada 
Na análise realizada pelo algoritmo um elemento N só pode ser 
considerado frequente se todos os seu N-1 forem frequentes 
Resposta 
Correta 
Na análise realizada pelo algoritmo um elemento N só pode ser 
considerado frequente se todos os seu N-1 forem frequentes 
Comentário da 
Resposta 
Resposta correta. A resposta está correta pois, Seguindo o princípio 
da antimonotonicidade de suporte, dentro de um algoritmo APRIORI, 
um k-itemset somente pode ser considerado frequente se todos os 
seus (n-1)-itemsets forem frequentes também. 
 
Pergunta 4 
A lógica FUZZY, tem suporte aos modos de raciocínio aproximados e não exatos aos 
elementos que compõem o conjunto. O algoritmo FUZZY APRIORI aplica-se extraindo 
atributos de valores quantitativos através de regras de associação com o intuito de 
reduzir o tempo computacional gasto. 
 
Levando em consideração a lógica do algoritmo é correto afirmar que: 
 
 
Resposta 
Selecionada 
Os itemsets frequentes são baseados no nível de suporte mínimo e do 
valor de confiança mínimo. 
Resposta 
Correta 
Os itemsets frequentes são baseados no nível de suporte mínimo e do 
valor de confiança mínimo. 
Comentário 
da Resposta 
A resposta está correta pois, na lógica FUZZY APRIORI, que é uma 
teoria matemática que permite a modelagem próximo a habilidade 
humana na tomada de decisão, encontra-se os itemsets frequentes 
baseado no valor de suporte mínimo, e através do valor mínimo de 
confiança, extraídos das regras de associação. 
 
Pergunta 5 
Ao ser realizado o agrupamento dos documentos que formarão a base de conhecimento 
a ser analisado, deverão ser definidos os descritores que irão auxiliar na interpretação 
dos resultados. O principal objetivo da tarefa é agir de forma exṕloratória. 
 
De acordo com a formação dos descritores é correto afirmar que: 
 
Resposta 
Selecionada 
Ao selecionar N documentos próximos a raiz, a seleção dos atributos 
deve ser realizada por aprendizado de máquina. 
Resposta 
Correta 
Ao selecionar N documentos próximos a raiz, a seleção dos atributos 
deve ser realizada por aprendizado de máquina. 
Comentário 
da Resposta 
A resposta está correta pois, ao selecionar os termos de N documentos 
que se encontram mais próximos à raiz, então através de técnicas 
específicas, selecionar atributos em tarefas de aprendizado de máquina 
os quais se aplicam aos descritores por agrupamento. 
 
Pergunta 6 
 Leia o excerto a seguir: 
 
”A análise de agrupamentos tem como objetivo descobrir a estrutura (ou classes) de um 
determinado conjunto de dados não rotulados, onde cada objeto é descrito por P 
variáveis. Perguntas freqüentes incluem: (1) Existem subgrupos menos heterogêneos 
nos dados?; (2) Quantos subgrupos de fato existem (se é que existem)?; (3) Que 
objetos fazem parte de cada subgrupo?; (4) Uma vez encontrado um modelo para a 
estrutura dos dados, poderíamos gerar regras de decisão que possibilitaram a 
classificação de novas amostras?; Como tratar tipos de variáveis diferentes? ” 
 
Conforme a afirmativa acima é correto declarar com referência às técnicas de 
agrupamento que: 
 
COSTA, J.A.F.; Segmentação do SOM por Métodos de Agrupamentos Hierárquicos 
com Conectividade Restrita . Departamento de Engenharia Elétrica. UFRN: Natal. 
CBRN (Congresso Brasileiro de Redes Neurais) - 2005. P.2. Disponível em: 
< https://pdfs.semanticscholar.org/b7e8/c79c8caae597cd167cdb0c409943dfad5f28.pdf > 
Acesso em: 01 Jan. 2020. 
 
 
Resposta 
Selecionada 
Complete Linkage é uma técnica onde a ligação entre os elementos 
ocorre com os vizinhos mais distantes. 
Resposta 
Correta 
Complete Linkage é uma técnica onde a ligação entre os elementos 
ocorre com os vizinhos mais distantes. 
 
https://pdfs.semanticscholar.org/b7e8/c79c8caae597cd167cdb0c409943dfad5f28.pdf
Comentário 
da Resposta 
A resposta está correta pois, A técnica é utilizada abordando o vizinho 
mais distante (Farthest Neighbor). De forma inversa ao single-linkage 
que é determinada a distância entre dois grupos pela maior distância 
entre o par de elementos, desde que pertençam a grupos distintos 
 
Pergunta 7 
Leia o excerto a seguir: 
 
“Frequentemente, os dados são encontrados com diversas inconsistências: registros 
incompletos, valores errados e dados inconsistentes. A etapa de limpeza dos dadosvisa 
eliminar estes problemas de modo que eles não influem no resultado dos algoritmos 
usados. As técnicas usadas nesta etapa vão desde a remoção do registro com 
problemas, passando pela atribuição de valores padrões, até a aplicação de técnicas de 
agrupamento para auxiliar na descoberta dos melhores valores” 
 
CAMILO, C.O.; SILVA, J.C.; Mineração de Dados: Conceitos, Tarefas, Métodos e 
Ferramentas . Instituto de Informática da UFG: Goiás. 2009. p.6. Disponível em: 
< http://www.portal.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-
09.pdf > acesso em: 05 Jan. 2020. 
 
Com base na citação proposta é correto afirmar que referente na execução da validação 
dos dados em um modelo: 
 
Resposta 
Selecionada 
Caso o problema encontrado seja na classificação dos dados, na 
regressão, o modelo precisa ser avaliado com diferentes amostras 
Resposta 
Correta 
Caso o problema encontrado seja na classificação dos dados, na 
regressão, o modelo precisa ser avaliado com diferentes amostras 
Comentário 
da Resposta 
A resposta está correta pois, ao conseguir encontrar os erros e o 
porquê dos mesmo é necessário se fazer a validação. Caso o 
problema seja basicamente na classificação dos dados, na regressão, 
o modelo precisa ser estimado levando em consideração diferentes 
amostras. 
 
Pergunta 8 
Leia o excerto a seguir: 
 
“O algoritmo APRIORI basicamente se divide em duas etapas que são: 
I) Encontrar todos os conjuntos de itens frequentes (que satisfazem à condição 
de suporte mínimo). 
II) A partir do conjunto de itens frequentes, gerar as regras de associação (que 
satisfazem à condição de confiança mínima).” 
 
GOLDSCHMIDT, R.; PASSOS, E. Data Mining: um guia prático . Elsevier Editora 
Ltda:São Paulo, 2005. p.106 
A partir do apresentado, analise as alternativas a seguir e marque a opção correta: 
Resposta 
Selecionada 
Os itens candidatos são definidos após a aceitação do suporte mínimo 
e o nível de confiança aceitável. 
Resposta 
Correta 
Os itens candidatos são definidos após a aceitação do suporte mínimo 
e o nível de confiança aceitável. 
Comentário 
da Resposta 
A resposta está correta pois, inicialmente ao definir a utilização da 
técnica, deve ser definido os valores de suporte e confiança mínimas 
http://www.portal.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf
http://www.portal.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf
utilizadas pelo algoritmo apriori para traçar as regras condizentes que 
definirão os itens candidatos. 
 
 
Pergunta 9 
Leia o excerto a seguir: 
 
“O dendrograma é um diagrama de árvore que exibe os grupos formados por 
agrupamento de observações em cada passo e em seus níveis de similaridade. O nível 
de similaridade é medido ao longo do eixo vertical (alternativamente, você pode exibir o 
nível de distância) e as diferentes observações são listadas ao longo do eixo horizontal.” 
 
DENDROGRAMA. Suporte ao minitab18, 2019. Disponível 
em: <encurtador.com.br/bjuGT> Acesso em: 01 Jan. 2020. 
 
A partir do apresentado, assinale a alternativa correta. 
 
Resposta 
Selecionada 
Quanto maior a distância entre os elementos do gráfico melhor se 
torna a distribuição entre os grupos. 
Resposta 
Correta 
Quanto maior a distância entre os elementos do gráfico melhor se 
torna a distribuição entre os grupos. 
Comentário 
da Resposta 
A resposta está correta pois, a distância entre os grupos formados 
pelos atributos da base de dados, também é algo importante a ser 
considerado, pois quanto maior a distância melhor é a relação interna 
dos elementos de cada grupo, e melhor é a distinção dos grupos. 
 
Pergunta 10 
Um modelo que deverá ser utilizado na mineração de dados corresponde ao 
processamento das informações de entradas que submetidas a determinadas condições 
e algoritmos devem retornar aquilo que foi definido como regras pelos analistas de 
negócio. Para que esse resultado seja conforme o esperado, protótipos que realizam 
testes exaustivos devem ser realizados. 
 
Em se tratando desses protótipos é correto afirmar que: 
 
Resposta 
Selecionada 
Dois tipos de modelos podem ser desenvolvidos, o preditivo e o 
descritivo, ambos com o propósito de analisar conceitos temporais 
Resposta 
Correta 
Dois tipos de modelos podem ser desenvolvidos, o preditivo e o 
descritivo, ambos com o propósito de analisar conceitos temporais 
Comentário 
da Resposta 
Resposta correta. A resposta está correta pois, o modelo preditivo 
consiste em prever futuros cenários baseado na análise de padrões 
que auxiliam em tomadas de decisão mais precisas, e o descritivo 
permite ao analista compreender os eventos em tempo real, não emite 
julgamento no valor, mas o impacto passado e futuro. 
 
Sexta-feira, 11 de Junho de 2021 20h22min25s BRT

Continue navegando