Prévia do material em texto
Fazer teste: Semana 7 - Atividade Avaliativa Informações do teste Descrição Instruções Olá, estudante! 1. Para responder a esta atividade, selecione a(s) alternativa(s) que você considerar correta(s); 2. Após selecionar a resposta correta em todas as questões, vá até o fim da página e pressione “Enviar teste”. 3. A cada tentativa, você receberá um novo conjunto de questões diferentes para que você responda e tente alcançar melhores resultados. Pronto! Sua atividade já está registrada no AVA. Várias tentativas Este teste permite 3 tentativas. Esta é a tentativa número 1. Forçar conclusão Este teste pode ser salvo e retomado posteriormente. Suas respostas foram salvas automaticamente. A partir da matriz de confusão apresentada a seguir, que é resultado de um processo de detecção de anomalias em uma base de dados, calcule a acurácia para os valores obtidos na matriz. Escolha a alternativa que contém o valor correto de acurácia. 0,8 0,75 0,9 ~ 0,3 ~ 0.77 PERGUNTA 1 1,5 pontos Salva As inconsistências em uma análise precisam ser identificadas e corrigidas para que os resultados da análise sejam os mais precisos possíveis. É por isso que anomalia, inconsistência e ruído diferem entre si Então essas diferenças res ltam em objeti os diferentes para PERGUNTA 2 1,5 pontos Salva Estado de Conclusão da Pergunta: Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as res 14/05/2024, 13:46 Fazer teste: Semana 7 - Atividade Avaliativa – Mineração... https://ava.univesp.br/webapps/assessment/take/launch.jsp?course_assessment_id=_188499_1&course_id=_12990_1&content_id=_1537256_1… 1/5 entre si. Então, essas diferenças resultam em objetivos diferentes para cada tarefa. Isso inclui encontrar e corrigir inconsistências. Ao analisar dados inconsistentes ou anomalias, é possível entender e prevenir problemas, como falhas no sistema, perdas de energia ou equipamentos danificados. É por isso que a maioria dos tratamentos se concentra na remoção do ruído. Avalie as afirmações a seguir e as correlacione adequadamente aos termos ou às ferramentas às quais se referem. 1. Ruídos. 2. Anomalias. 3. Inconsistências. I. São valores fora do domínio ou da normalização de uma variável ou valores que diferem significativamente de outros valores. II. A exceção é que tenham interesse ou relevância prática, como identificar uma falha em um sistema, uma fraude ou um intruso em uma rede. III. Uma quantidade que causa alguma variação no valor dos dados em relação ao valor sem ruído não tem significado prático, mas, geralmente, afeta os resultados da análise de forma negativa. Assinale a alternativa que correlaciona adequadamente os dois grupos de informações. a. 1-II; 2-I; 3-III. b. 1-III; 2-I; 3-II. c. 1-I; 2-II; 3-III. d. 1-I; 2-III; 3-II. e. 1-III; 2-II; 3-I. Alguns métodos estatísticos não requerem um modelo específico ou uma distribuição de dados específica. Eles são chamados de “não paramétricos”, e os métodos mais populares nessa categoria são baseados em histogramas. Os histogramas geralmente são usados sem supervisão e não são determinados por nenhum modelo. Com relação a alguns métodos não paramétricos existentes, avalie as afirmativas a seguir. I. Análise de histograma (tipo 1): o método estatístico não paramétrico mais comumente usado é a observação análise de histograma. II. Análise de histograma (tipo 2): definir adequadamente a distância entre os objetos de teste e os objetos base de treinamento. III. Análise de histograma (tipo 3): método mais utilizado para medir a distância entre dois objetos. É correto o que se afirma em: a. I, II e III. b. I e III, apenas. c I II PERGUNTA 3 1,5 pontos Salva Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as res 14/05/2024, 13:46 Fazer teste: Semana 7 - Atividade Avaliativa – Mineração... https://ava.univesp.br/webapps/assessment/take/launch.jsp?course_assessment_id=_188499_1&course_id=_12990_1&content_id=_1537256_1… 2/5 c. I e II, apenas. d. I, apenas. e. II e III, apenas. Sobre os métodos de detecção de anomalias, escolha a alternativa que relaciona corretamente os métodos apresentados abaixo com as categorias às quais eles pertencem. 1. Métodos algorítmicos 2. Métodos estatísticos I. Diagrama de caixa II. k-vizinhos mais próximos III. Análise de histograma IV. k-médias V. Redes neurais competitivas VI. Regressão linear 1 – II, IV e V; 2 – I, III e VI 1 – II, III e IV; 2 – I, V e VI 1 – I, III e VI; 2 – II, IV e V 1 – I, II e V; 2 – III, IV e VI 1 – III, IV e V; 2 – I, II e VI PERGUNTA 4 1,5 pontos Salva A detecção de anomalias em bancos de dados é fundamental para se observar uma falha de especificação binária, em que um ou mais objetos são determinados como pertencentes a uma classe normal ou __________(Lacuna 1). Portanto, o processo é muito semelhante ao fluxo de tarefa de previsão tradicional. A maioria dos __________(Lacuna 2) de anomalias determina algum limite ou __________(Lacuna 3) em volta de uma das classes (normal ou anormal) e, com base nisso, estabelece um limite de normal ou anormal. Outros métodos incluem o uso de informações sobre a densidade do objeto em uma região, tamanho da região ou outros critérios de limite. Preencha as lacunas, escolhendo a alternativa correta. a. Anômala, algoritmos de detecção, vizinhança. b. Anômala, processos de detecção, distância. c. Normalizada, algoritmos de detecção,vizinhança. PERGUNTA 5 1,5 pontos Salva Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as res 14/05/2024, 13:46 Fazer teste: Semana 7 - Atividade Avaliativa – Mineração... https://ava.univesp.br/webapps/assessment/take/launch.jsp?course_assessment_id=_188499_1&course_id=_12990_1&content_id=_1537256_1… 3/5 I e II, apenas o a ada, a go t os de detecção, a ça d. Normalizada, algoritmos de detecção, distância. e. Normalizada, processos de detecção, vizinhança. Os métodos que levam em conta a proximidade são fáceis de criar e não exigem suposições sobre a distribuição dos dados subjacentes. Eles podem ser aplicados sem supervisão ou supervisionados e dependem do cálculo de alguma distância entre pares de objetos no banco de dados. Esse cálculo define um espaço métrico definido sobre um número finito de atributos. Os objetos, então, são mapeados nesse espaço por métrica. Diferentes medições podem ser usadas para determinar a distância entre os objetos. Uma escolha comum para bases univariadas ou multivariadas que contêm atributos contínuos é a distância euclidiana, que assume contribuição igual para cada atributo. No entanto, esse método não é adequado para muitas aplicações devido à sua falta de eficácia. Avalie as afirmações a seguir sobre métodos baseados em proximidade e as correlacione adequadamente aos termos ou às ferramentas às quais se referem. 1. k-NN (tipo 1). 2. k-NN (tipo 2). 3. Fator local de anomalia (tipo 1). I. Procedimento fundamentado no algoritmo dos k vizinhos mais adjacentes. II. Procedimento em que os k vizinhos mais adjacentes de determinado objeto são rotulados de acordo com o posto dos vizinhos mais próximos. III. Um algoritmo chamado Local Outlier Factor (LOF) procura desvios entre determinado objeto e seus vizinhos. Assinale a alternativa que correlaciona adequadamente os dois grupos de informações. a. 1-I; 2-III; 3-II. b. 1-I; 2-II; 3-III. c. 1-II; 2-I; 3-III. d. 1-III; 2-II; 3-I. e. 1-III; 2-I; 3-II. PERGUNTA 6 2,5 pontos Salva Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as res 14/05/2024, 13:46 Fazer teste: Semana 7 - Atividade Avaliativa – Mineração... https://ava.univesp.br/webapps/assessment/take/launch.jsp?course_assessment_id=_188499_1&course_id=_12990_1&content_id=_1537256_1… 4/5 Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as res 14/05/2024, 13:46Fazer teste: Semana 7 - Atividade Avaliativa – Mineração... https://ava.univesp.br/webapps/assessment/take/launch.jsp?course_assessment_id=_188499_1&course_id=_12990_1&content_id=_1537256_1… 5/5