Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
PESQUISA OPERACIONAL II P.O. II MINERAÇÃO DE DADOS - WEKA PROCESSO KDD CLASSIFY CLUSTER ASSOCIATE ALUNOS: GISELLE L. MACARINELI – 18985 JOSÉ A. DA SILVA JUNIOR – 18910 JOSÉ L. LUIS JUNIOR – 19069 ROBSON R. M. MARCONSINI – 18067 PROF.: VALDEREDO SEDANO FONTANA 6º P. ENG. DE PROD. LIMPEZA DA BASE DE DADOS A PRINCÍPIO FOI NECESSÁRIA A LIMPEZA DA BASE DE DADOS QUE CONSISTE EM: FILTRAR; COMBINAR; E PREENCHER ESPAÇOS VAZIOS. A BASE COM DADOS DA SEDU COM OS INSCRITOS NO PROCESSO SELETIVO PARA O ANO DE 2014 JA HAVIA SIDO PREVIAMENTE LIMPA (PRÉ-PROCESSADA) PELO PROFESSOR: DE UM TOTAL DE 12.292 REGISTROS FORAM UTILIZADOS APENAS A 3.051, PERTENCENTES A MACRORREGIÃO SUL DO ESTADO DO ESPÍRITO SANTO, DE NOSSO INTERESSE PARA ANALISAR O PERFIL DOS CANDIDATOS AOS CURSOS DE NÍVEL TÉCNICO PROFISSIONALIZANTE NO ESTADO, MAIS DIRECIONADOS PARA A REGIAO SUL. FORAM RETIRADOS ATRIBUTOS VISANDO MELHORAR O DESEMPENHO DO ALGORITMO, COMO E-MAIL, DATA DE NASCIMENTO E CPF, POR EXEMPLO. AS NOTAS NAS DISCIPLINAS DE PORTUGUÊS E MATEMÁTICA FORAM COMBINADAS E UNIFICADAS EM UM VALOR MÉDIO. ETC. BASE DE DADOS LIMPA APÓS O PRÉ-PROCESSAMENTO, RESULTARAM NA BASE DISPONIBILIZADA PELO PROFESSOR APENAS OS SEGUINTES ATRIBUTOS: CURSOS; SEXO; IDADE; PORTUGUÊS; E MATEMÁTICA. OS QUAIS FORAM LIMPOS E CONVERTIDOS EM FORMATO CSV (SEPARADO POR VÍRGULAS). ESSES ATRIBUTOS FORAM MINERADOS COM A UTILIZAÇÃO DO WEKA (Waikato Enviroment for Knowledge Analysis), UMA SUÍTE DE MINERAÇÃO DE DADOS CRIADA NAS DEPENDÊNCIAS DA UNIVERSIDADE DE WAIKATO, EM NOVA ZELÂNDIA, E DESENVOLVIDO UTILIZANDO A LINGUAGEM JAVA. POR SER UM SOFTWARE LIVRE DISPONÍVEL SOB A LICENÇA GPL, É TOTALMENTE GRATUITO. REPRESENTAÇÃO GRÁFICA APÓS IMPORTAÇÃO DA BASE LIMPA, FOI POSSÍVEL GERAR GRÁFICOS DE ACORDO COM O ATRIBUTO SELECIONADO: CURSOS; SEXO; IDADE; PORTUGUÊS; E MATEMÁTICA. ATRIBUTO: “CURSOS” ATRIBUTO: “SEXO” ATRIBUTO: “IDADE” ATRIBUTO: “PORTUGUÊS” ATRIBUTO: “MATEMÁTICA” TAREFA DE CLASSIFICAÇÃO: “CLASSIFY” UTILIZAÇÃO DO ALGORITMO J48. TAREFA DE CLUSTERIZAÇÃO: “CLUSTER” UTILIZAÇÃO DO ALGORITMO SIMPLEKMEANS. TAREFA DE CLUSTERIZAÇÃO: “CLUSTER” UTILIZAÇÃO DO ALGORITMO SIMPLEKMEANS TAREFA DE ASSOCIAÇÃO: “ASSOCIATE” -UTILIZAÇÃO DO ALGORITMO APRIORI. CONCLUSÕES NA FAIXA DE NOTA >=60 E <80 EM PORTUGUÊS SÃO ENCONTRADOS 322 ALUNOS DO SEXO MASCULINO; NA MESMA FAIXA DE NOTA, MAS EM MATEMÁTICA, SÃO ENCONTRADOS 262 ALUNOS DO SEXO MASCULINO; PARA ALUNOS COM IDADE <25 E NOTAS >=60 E <80 EM PORTUGUÊS SÃO ENCONTRADOS 465 ALUNOS DE AMBOS OS SEXOS; PARA A MESMA FAIXA DE IDADE E DE NOTA, MAS EM MATEMÁTICA, SÃO ENCONTRADOS 365 ALUNOS DE AMBOS OS SEXOS; PARA O SEXO FEMININO E NOTAS NA FAIXA >=60 E <80 SÃO ENCONTRADOS 537 ALUNOS EM PORTUGUÊS; E PARA A MESMA FAIXA DE IDADE E SEXO, MAS EM MATEMÁTICA, SÃO ENCONTRADOS 401 ALUNOS. OBRIGADO!!!
Compartilhar