Baixe o app para aproveitar ainda mais
Prévia do material em texto
Questão 1/10 - Mineração de Dados (E) A que etapa o texto se refere: "Nesta etapa são identificadas as características de maior relevância encontradas nas características originais." A Etapa de representação de objeto. Você assinalou essa alternativa (A) B Etapa de seleção de medida de similaridade. C Etapa de agrupamento de dados. D Etapa de abstração dos dados. Questão 2/10 - Mineração de Dados (E) A classificação é uma das tarefas da Mineração de Dados. Encontramos na classificação um dos pontos mais importantes para a análise de dados. O agrupamento de dados executado na classificação é vital para o resultado da análise, a qual vem sendo aplicada em diversos campos de investigação, destacando-se ciências sociais, economia, medicina, engenharia e data mining. Com relação aos tipos de classificadores é correto afirmar: A Na classificação supervisionada são agrupados diferentes elementos que possuem características comuns, por classes. Esse tipo de agrupamento é composto por cinco etapas. B A classificação não-supervisionada é também conhecida como análise discriminante. Apresenta um conjunto de indivíduos previamente classificados, objetivando encontrar uma regra que possibilite efetuar a classificação de um novo indivíduo. C A classificação supervisionada possui 5 etapas que são: Etapa de representação de objeto, Etapa de seleção de medida de similaridade, Etapa de agrupamento de dados, Etapa de abstração dos dados e Etapa de validação. D A classificação supervisionada é também conhecida como análise discriminante. Apresenta um conjunto de indivíduos previamente classificados, objetivando encontrar uma regra que possibilite efetuar a classificação de um novo indivíduo. Você assinalou essa alternativa (D) Questão 3/10 - Mineração de Dados (E) A qual método o texto se referencia: Esse método permite que uma pessoa ou organização efetue comparações entre as possíveis ações baseadas em custos, benefícios, probabilidade de ocorrência e metas para lucros. A Matriz de Regressão. B Método da Árvore de Decisão. Você assinalou essa alternativa (B) C Matriz de confusão D Método de Confluência Questão 4/10 - Mineração de Dados (E) Entre as técnicas de análise de agrupamento ou clustering, encontram-se os métodos de particionamento, hierárquicos, com base na densidade, em grid, em modelos por meio de uma abordagem de redes neurais e estatística. Sobre seus processos, de modo geral, é correto afirmar: A Esses métodos podem ser entendidos como compreendendo um conjunto de técnicas de análise de agrupamento (clustering) com o objetivo de efetuar uma detecção da existência de diferentes grupos inseridos em um conjunto de dados. Você assinalou essa alternativa (A) B Quando ocorrer o caso de uma existência de diferentes grupos inseridos em um conjunto de dados, essas técnicas devem dificultar a determinação de quais são esses grupos. C O clustering utiliza as técnicas de mineração de dados visando efetuar um agrupamento e embaralhamento. A categorização dos dados somente pode ser disjunta (separada) com possibilidade de ser organizadas em árvores. D O objetivo do clustering está baseado na elaboração de um problema por meio do uso de uma função de diferenciação onde esse clustering faz a junção de um grupo de informações em grandes conjuntos. Questão 5/10 - Mineração de Dados (E) Com o crescimento e a evolução da WEB, o volume de informações que trafegam na internet vem alcançando uma proporção extremamente alta, dificultando que o usuário consiga atingir a informação desejada. Começam a surgir os sistemas de recomendação como uma alternativa para essa dificuldade, pela sugestão de um conteúdo de maneira personalizada. Nesse contexto, o modelo ou técnica de classificação k-Nearest Neighbors (kNN) se apresenta como um método simples e com a capacidade de fornecer excelentes resultados. Com relação ao método kNN, é correto afirmar: A O fato determinante para determinar a proximidade relativa aos vizinhos é calculado por uma distância ou por instâncias entre eles. Para isso, as fórmulas mais utilizadas são de cálculo de proximidade relativa direta, usando regra de três simples. B Seu funcionamento possibilita a geração de recomendações a partir de avaliações dos usuários. Esse método de machine learning tem por objetivo efetuar uma classificação de um elemento atribuindo a ele um rótulo que se apresenta mais frequente dentre as k amostras mais próximas a ele, utilizando um sistema de eleição. Você assinalou essa alternativa (B) C Para efetuar o cálculo necessário para definir o rótulo de classificação de um elemento o kNN necessita de uma definição de k, sendo k a distância direta para o vizinho mais próximo a serem utilizado pelo algoritmo. D O valor a ser utilizado para a definição de k varia na razão direta conforme a distância de um vizinho. Questão 6/10 - Mineração de Dados (E) A detecção de anomalias constitui-se da utilização de técnicas que identificam padrões de comportamento inesperado, sendo estes considerados eventos ou observações que criam uma suspeita de problema. Essa técnica de detecção possibilita uma ampla gama de aplicações possíveis. A alternativa que discorre sobre outliers é: A Com uso de técnicas de detecção é possível analisar ocorrências de outliers, proporcionando maior efetividade para a inclusão de dados, impactando por exemplo em ganhos de efetividade de banco de dados. B As anomalias ou eventos raros podem impactar tanto positivamente quanto negativamente aos objetivos desejados. Você assinalou essa alternativa (B) C Em anomalias de contexto ocorre uma caracterização por meio de um conjunto de dados anômalo. É necessária uma relação para o conjunto de dados sendo ele espacial, sequencial ou grafo. D Observando um agrupamento de dados reais, é impossível o aparecimento de casos com comportamento diferente da maioria. Questão 7/10 - Mineração de Dados (E) Uma árvore de decisão visa auxiliar em decisões complexas. Ela é na verdade um mapa que apresenta as possibilidades de resultados para uma sequência de escolhas relacionadas.. A respeito do método da árvore de decisão, é correto afirmar: A Esse método permite que uma pessoa ou uma organização efetue comparações entre as possíveis ações baseadas em custos, benefícios, probabilidade de ocorrência e metas para lucros. Você assinalou essa alternativa (A) B Apesar de em alguns casos poder ser utilizada na condução de diálogos, não pode ser utilizado na condução de diálogos informais ou mesmo o mapeamento de um algoritmo para previsão de melhor escolha de forma matemática. C A estrutura apresentada por uma árvore de decisão tem sua representação formalizada em somente 3 elementos, nó raiz, ramos e folhas. D Em geral, a arvore de decisão inicia-se por um nó único que se subdivide em possíveis resultados. Para cada resultado vão surgindo novos nós adicionais que não permitem outras possibilidades representadas por novas ramificações. Questão 8/10 - Mineração de Dados (E) A avaliação ou análise de cluster, tem como finalidade estudar as relações de interdependência existentes entre um conjunto de variáveis interdependentes, possibilitando agrupar elementos conforme suas similaridades e proximidades, considerando esse conjunto de variáveis. Nesse contexto é correto a afirmativa: A Os elementos que compõe cada cluster tendem a ser análogos entre si, sendo semelhantes dos outros elementos presentes em outros clusters. B O processo de avaliação do resultado obtido a partir de um algoritmo é denominado também de validação. Você assinalou essa alternativa (B) C O processo de avaliação do resultado obtido a partir de um algoritmo é denominado de absorção de dados. D Os elementos que compõe cada cluster tendem a ser semelhantes entre si, sendo também semelhantes dos outros elementos presentes em outros clusters. Questão 9/10 - Mineração de Dados (E) As RNAs (redes neurais artificiais ) do tipo MLP (Multilayer Perceptron) e RBF (Radial Basis Function) compreendem funcionalidadesque se destacam na mineração de dados sendo amplamente utilizadas nesse tipo de atividade. Com relação às RNAs, no que se refere ao uso de ferrantas, é correto afirmar que: Você não pontuou essa questão A O poder computacional apresentado nas redes RBF é amplamente superior em relação as redes sem camadas escondidas por possuírem a capacidade de tratar dados que se apresentam como não linearmente separáveis. B Nas redes RBF, para seu funcionamento é utilizado o algoritmo backpropagation convencional. Com isso ocorre uma tendência a uma convergência de maneira extremamente lenta, e ainda, exigindo um alto esforço computacional. C As redes neurais do tipo RBF que fazem uso de treinamento backpropagation apresentam problemas principalmente no quesito de definição de parâmetros. A utilização de diferenças mesmo que mínimas impacta em elevadas diferenças em tempo de treinamento e em resultados como na generalização obtida. Você assinalou essa alternativa (C) D O modelo de rede RBF, pode ser utilizado quase que em todos os tipos de problemas tratados pelo MLP. Contudo, enquanto as redes MLP podem possuir mais de uma camada oculta, a configuração padrão da RBF contempla apenas uma camada intermediária, onde a função de ativação é de base radial, em que a de maior utilização é a função gaussiana. Questão 10/10 - Mineração de Dados (E) Os algoritmos genéticos são caracterizados como: A Sistemas que agem como seres humanos. B Uma classe de algoritmos de busca. Você assinalou essa alternativa (B) C Orientação a metas e objetivos. D Desenvolvimento de estruturas cognitivas.
Compartilhar