Buscar

Prova - Unidade 4 - Mineração de dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

• Pergunta 1 
1 em 1 pontos 
 
Bancos de dados de sistemas varejistas possuem insights escondidos que 
podem auxiliar na melhora no relacionamento com os clientes, e alavancar 
as receitas. Para que isso venha a ocorrer é importante que a mineração de 
dados seja coerente e muito precisa, por isso deve ser feito a prototipagem, 
validação do modelo e seu desenvolvimento final. 
 
Neste sentido, é correto afirmar que: 
 
 
Resposta 
Selecionada: 
 
No modelo Jacknife em N observações a predição dos 
dados é feita com base N - 1 comparando-se o valor da 
exclusão 
Resposta 
Correta: 
 
No modelo Jacknife em N observações a predição dos 
dados é feita com base N - 1 comparando-se o valor da 
exclusão 
Comentário 
da resposta: 
Resposta correta. A resposta está correta pois, O modelo 
Jacknife, em N observações exclui-se 1 (uma) 
aleatoriamente. Faz-se a predição com base N - 1 e se 
compara com o valor conhecido da exclusão. Repete-se o 
processo enquanto que a distribuição de erros valida ou não 
o modelo. 
 
 
• Pergunta 2 
1 em 1 pontos 
 
Leia o excerto a seguir: 
 
“Os algoritmos de agrupamento hierárquico podem ser aglomerativos ou 
divisivos. 
No agrupamento hierárquico aglomerativo, inicialmente cada documento 
pertence a um grupo e, em cada iteração, os pares de grupos mais 
próximos são unidos até se formar um único grupo.” 
 
REZENDE, S.O.;MARCACINI, R.M.;MOURA, M.F.; O uso da Mineração de 
Textos para Extração e Organização Não Supervisionada de Conhecimento. 
Revista de Sistemas de Informação da FSMA. ICMC-USP. 2011. p.12. 
Disponível em: 
< http://www.fsma.edu.br/si/edicao7/FSMA_SI_2011_1_Principal_3.pdf > 
Acesso em: 01 Jan. 2020. 
 
A partir do apresentado, analise as asserções a seguir e a relação proposta 
entre elas. 
 
I. Um agrupamento hierárquico aglomerativo, ocorre quando os pares 
(documentos) formam um único grupo 
II. Tanto a hierarquia divisiva quanto aglomerativa resultam em uma árvore 
 
http://www.fsma.edu.br/si/edicao7/FSMA_SI_2011_1_Principal_3.pdf
binária denominada dendrograma 
III. No agrupamento a junção é somente na iteração inicial sendo 
improcedente a mesma em outras iterações 
IV. Um dendrograma é formado quando um grupo com todos os 
documentos de dividem em grupos 
 
A seguir, assinale a alternativa correta: 
 
Resposta Selecionada: 
I e II, apenas. 
Resposta Correta: 
I e II, apenas. 
Comentário 
da resposta: 
Resposta correta. A resposta está correta pois, ao ser 
aglomerativo, ocorre quando cada documento pertence a 
um grupo, e em cada junção os pares próximos se unem até 
que no fim formam um único grupo. Tanto o hierárquico 
divisivo quanto o aglomerativo resultam em uma árvore 
binária denominada Dendrograma 
 
 
• Pergunta 3 
0 em 1 pontos 
 
Um dos grandes problemas dentro de um escalonamento estático ou até 
mesmo dinâmico está na formalização da utilização de um conjunto de 
tarefas aplicadas paralelamente em um sistema multiprocessado, assim 
como o gasto que ocorrerá no processamento. 
 
Isso gera diversas dificuldades ao sistema o qual é correto afirmar: 
 
 
Resposta 
Selecionada: 
 
Em se tratando de tarefas sendo executadas em paralelo 
de forma preemptiva, podendo ser interrompida por outro 
evento 
Resposta 
Correta: 
 
Uma aplicação multiprocessada consiste em vários 
processadores alocados com uma memória local e 
comunicação por troca de mensagens. 
Comentário 
da resposta: 
Sua resposta está incorreta. A resposta está incorreta pois, 
as tarefas ocorrem de forma não preemptiva, uma tarefa 
não pode ser interrompida por outro evento, ou seja, o 
processador só é liberado ao terminar a execução, o 
problema observado é encontrar um escalonamento que 
trata um tempo menor para o total da execução da 
aplicação, assim como deve ocorrer, o escalonamento, de 
forma que a precedência entre as tarefas seja respeitado 
 
 
• Pergunta 4 
0 em 1 pontos 
 
A classificação dos elementos de forma não supervisionada traz consigo 
alguns problemas como a necessidade de definição da quantidade de 
clusters que serão formados, assim como o agrupamento dos atributos e 
valores com padrões não rotulados que tenha algum significado ou 
propriedades comuns entre si. 
 
Dessa forma é correto afirmar que: 
 
 
Resposta 
Selecionada: 
 
Os elementos que compõem diferentes classes em uma 
única base de dados possui uma alta similaridade, pois 
levam a um único resultado 
Resposta 
Correta: 
 
Nos casos da existência de K automático, o total de 
combinações possíveis possuem um incremento 
significativo 
Comentário 
da resposta: 
Sua resposta está incorreta. A resposta está incorreta pois, 
a rotulação dos clusters é feita pelo usuário pois ela tem 
como objetivo facilitar a criação das bases de conhecimento 
do negócio, é preciso afirmar que elementos em 
agrupamentos diferentes, em uma mesma base, possuam 
alta dissimilaridade, sendo K conhecido ou gerado 
automaticamente, e cada configuração se avalia por uma 
função-objetivo que diz se o modelo se encontra apropriado 
ou não. 
 
 
• Pergunta 5 
1 em 1 pontos 
 
Leia o excerto a seguir: 
 
“O dendrograma é um diagrama de árvore que exibe os grupos formados 
por agrupamento de observações em cada passo e em seus níveis de 
similaridade. O nível de similaridade é medido ao longo do eixo vertical 
(alternativamente, você pode exibir o nível de distância) e as diferentes 
observações são listadas ao longo do eixo horizontal.” 
 
DENDROGRAMA. Suporte ao minitab18, 2019. Disponível 
em: <encurtador.com.br/bjuGT> Acesso em: 01 Jan. 2020. 
 
A partir do apresentado, assinale a alternativa correta. 
 
 
Resposta 
Selecionada: 
 
Quanto maior a distância entre os elementos do gráfico 
melhor se torna a distribuição entre os grupos. 
Resposta 
Correta: 
 
Quanto maior a distância entre os elementos do gráfico 
melhor se torna a distribuição entre os grupos. 
 
Comentário 
da resposta: 
Resposta correta. A resposta está correta pois, a distância 
entre os grupos formados pelos atributos da base de dados, 
também é algo importante a ser considerado, pois quanto 
maior a distância melhor é a relação interna dos elementos 
de cada grupo, e melhor é a distinção dos grupos. 
 
• Pergunta 6 
1 em 1 pontos 
 
A mineração de dados é a representação de diversos métodos e técnicas 
usados em diferentes capacidades analíticas que forma modelos de negócio 
organizando diferentes níveis de entrada que são organizadas pelos 
analistas de negócio formando assim modelos que poderão ser utilizados 
para a tomada de decisão da empresa. Após inúmeros testes e validações a 
formação do modelo é concluída para se chegar a determinadas decisões. 
 
Neste sentido, é correto afirmar que: 
 
 
Resposta 
Selecionada: 
 
Os parâmetros de entrada que irão compor o modelo 
precisa seguir critérios bem definidos pelos analistas 
Resposta 
Correta: 
 
Os parâmetros de entrada que irão compor o modelo 
precisa seguir critérios bem definidos pelos analistas 
Comentário 
da resposta: 
Resposta correta. A resposta está correta pois, a 
alimentação dos parâmetros de entrada no modelo precisa 
ser criteriosa a fim de se chegar a resultados coerentes em 
determinado problema. Por mais complexo que pareça não 
existe modelo certo ou errado, assim como técnica mais 
correta, o que existe é se o uso que está sendo feito é o 
mais correto ou apresenta um número extenso de falhas. 
 
 
• Pergunta 7 
1 em 1 pontos 
 
Ao ser realizado o agrupamento dos documentos que formarão a base de 
conhecimento a ser analisado, deverão ser definidos os descritores que irão 
auxiliar na interpretação dos resultados. O principal objetivo da tarefa é agir 
de forma exṕloratória. 
 
De acordo com a formação dos descritores é correto afirmar que: 
 
 
Resposta 
Selecionada: 
 
Ao selecionar N documentos próximos a raiz, a seleção 
dos atributos deve ser realizada por aprendizado de 
máquina. 
Resposta 
Correta: 
 
 
Ao selecionar N documentospróximos a raiz, a seleção 
dos atributos deve ser realizada por aprendizado de 
máquina. 
Comentário 
da resposta: 
Resposta correta. A resposta está correta pois, ao 
selecionar os termos de N documentos que se encontram 
mais próximos à raiz, então através de técnicas específicas, 
selecionar atributos em tarefas de aprendizado de máquina 
os quais se aplicam aos descritores por agrupamento. 
 
• Pergunta 8 
1 em 1 pontos 
 
Foi proposto um método de extração de atributos e valores do banco de 
dados de valores quantitativos, de forma a mapear tais atributos em um 
conjunto discretizado de inteiros consecutivos. Logo em seguida é 
organizado os itemsets frequentes que possuem um suporte superior ao 
mínimo definido pelo usuário. 
 
De acordo com a afirmativa podemos dizer que: 
 
 
Resposta 
Selecionada: 
 
Após a definição das regras de associação a serem 
aplicadas deve-se determinar as partições para cada 
atributo quantitativo. 
Resposta 
Correta: 
 
Após a definição das regras de associação a serem 
aplicadas deve-se determinar as partições para cada 
atributo quantitativo. 
Comentário 
da resposta: 
Resposta correta. A resposta está correta pois, é proposto 
primeiro determinar as partições utilizadas para cada 
atributo de forma quantitativa, e então mapear todos os 
valores de cada atributo no banco de dados em um 
conjunto discretizado de inteiros consecutivos. 
 
 
• Pergunta 9 
1 em 1 pontos 
 
Leia o excerto a seguir: 
 
”A análise de agrupamentos tem como objetivo descobrir a estrutura (ou classes) de um 
determinado conjunto de dados não rotulados, onde cada objeto é descrito por P 
variáveis. Perguntas freqüentes incluem: (1) Existem subgrupos menos heterogêneos 
nos dados?; (2) Quantos subgrupos de fato existem (se é que existem)?; (3) Que 
objetos fazem parte de cada subgrupo?; (4) Uma vez encontrado um modelo para a 
estrutura dos dados, poderíamos gerar regras de decisão que possibilitaram a 
classificação de novas amostras?; Como tratar tipos de variáveis diferentes? ” 
 
Conforme a afirmativa acima é correto declarar com referência às técnicas de 
agrupamento que: 
 
COSTA, J.A.F.; Segmentação do SOM por Métodos de Agrupamentos Hierárquicos 
com Conectividade Restrita . Departamento de Engenharia Elétrica. UFRN: Natal. 
CBRN (Congresso Brasileiro de Redes Neurais) - 2005. P.2. Disponível em: 
< https://pdfs.semanticscholar.org/b7e8/c79c8caae597cd167cdb0c409943dfad5f28.pdf > 
Acesso em: 01 Jan. 2020. 
 
Resposta 
Selecionada: 
 
Complete Linkage é uma técnica onde a ligação entre os elementos 
ocorre com os vizinhos mais distantes. 
Resposta Correta: 
Complete Linkage é uma técnica onde a ligação entre os elementos 
ocorre com os vizinhos mais distantes. 
Comentário 
da resposta: 
Resposta correta. A resposta está correta pois, A técnica é utilizada 
abordando o vizinho mais distante (Farthest Neighbor). De forma 
inversa ao single-linkage que é determinada a distância entre dois 
grupos pela maior distância entre o par de elementos, desde que 
pertençam a grupos distintos 
 
• Pergunta 10 
1 em 1 pontos 
 
Leia o excerto a seguir: 
 
 “O diferencial deste algoritmo[apriori] está na criação dos itemsets 
candidatos usando a propriedade anti-monotonicity que garante que, se um 
conjunto de itens não for frequente, então todos os seus super conjuntos 
também não são frequentes. Assim, o algoritmo aumenta seu desempenho, 
já que não perde tempo varrendo e analisando esses super conjuntos. ” 
 
CASTRO, R.F.V.; Análise de desempenho dos algoritmos Apriori e 
Fuzzy Apriori na extração de regras de associação aplicados a um 
Sistema de Detecção de Intrusos . Dissertação para Mestrado. UERJ: Rio 
de Janeiro. 2014 
 
A partir do apresentado, analise as asserções a seguir e marque a opção 
correta. 
 
 
Resposta 
Selecionada: 
 
Na análise realizada pelo algoritmo um elemento N só 
pode ser considerado frequente se todos os seu N-1 
forem frequentes 
Resposta 
Correta: 
 
Na análise realizada pelo algoritmo um elemento N só 
pode ser considerado frequente se todos os seu N-1 
forem frequentes 
Comentário 
da resposta: 
Resposta correta. A resposta está correta pois, Seguindo o 
princípio da antimonotonicidade de suporte, dentro de um 
algoritmo APRIORI, um k-itemset somente pode ser 
 
https://pdfs.semanticscholar.org/b7e8/c79c8caae597cd167cdb0c409943dfad5f28.pdf
considerado frequente se todos os seus (n-1)-itemsets 
forem frequentes também.

Continue navegando