Buscar

Mineração_de_Dados-Weka_POII_1ºB_6ºEPR

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

PESQUISA OPERACIONAL II
P.O. II
MINERAÇÃO DE DADOS - WEKA
PROCESSO KDD
CLASSIFY
CLUSTER
ASSOCIATE
ALUNOS:
GISELLE L. MACARINELI – 18985
JOSÉ A. DA SILVA JUNIOR – 18910
JOSÉ L. LUIS JUNIOR – 19069
ROBSON R. M. MARCONSINI – 18067
PROF.: VALDEREDO SEDANO FONTANA
6º P. ENG. DE PROD.
LIMPEZA DA BASE DE DADOS
A PRINCÍPIO FOI NECESSÁRIA A LIMPEZA DA BASE DE DADOS QUE CONSISTE EM:
FILTRAR;
COMBINAR; E
PREENCHER ESPAÇOS VAZIOS.
A BASE COM DADOS DA SEDU COM OS INSCRITOS NO PROCESSO SELETIVO PARA O ANO DE 2014 JA HAVIA SIDO PREVIAMENTE LIMPA (PRÉ-PROCESSADA) PELO PROFESSOR:
DE UM TOTAL DE 12.292 REGISTROS FORAM UTILIZADOS APENAS A 3.051, PERTENCENTES A MACRORREGIÃO SUL DO ESTADO DO ESPÍRITO SANTO, DE NOSSO INTERESSE PARA ANALISAR O PERFIL DOS CANDIDATOS AOS CURSOS DE NÍVEL TÉCNICO PROFISSIONALIZANTE NO ESTADO, MAIS DIRECIONADOS PARA A REGIAO SUL.
FORAM RETIRADOS ATRIBUTOS VISANDO MELHORAR O DESEMPENHO DO ALGORITMO, COMO E-MAIL, DATA DE NASCIMENTO E CPF, POR EXEMPLO.
AS NOTAS NAS DISCIPLINAS DE PORTUGUÊS E MATEMÁTICA FORAM COMBINADAS E UNIFICADAS EM UM VALOR MÉDIO.
ETC.
BASE DE DADOS LIMPA
APÓS O PRÉ-PROCESSAMENTO, RESULTARAM NA BASE DISPONIBILIZADA PELO PROFESSOR APENAS OS SEGUINTES ATRIBUTOS:
CURSOS;
SEXO;
IDADE;
PORTUGUÊS; E
MATEMÁTICA.
OS QUAIS FORAM LIMPOS E CONVERTIDOS EM FORMATO CSV (SEPARADO POR VÍRGULAS).
ESSES ATRIBUTOS FORAM MINERADOS COM A UTILIZAÇÃO DO WEKA (Waikato Enviroment for Knowledge Analysis), UMA SUÍTE DE MINERAÇÃO DE DADOS CRIADA NAS DEPENDÊNCIAS DA UNIVERSIDADE DE WAIKATO, EM NOVA ZELÂNDIA, E DESENVOLVIDO UTILIZANDO A LINGUAGEM JAVA. 
POR SER UM SOFTWARE LIVRE DISPONÍVEL SOB A LICENÇA GPL, É TOTALMENTE GRATUITO.
REPRESENTAÇÃO GRÁFICA
APÓS IMPORTAÇÃO DA BASE LIMPA, FOI POSSÍVEL GERAR GRÁFICOS DE ACORDO COM O ATRIBUTO SELECIONADO:
CURSOS;
SEXO;
IDADE;
PORTUGUÊS; E
MATEMÁTICA.
ATRIBUTO: “CURSOS”
ATRIBUTO: “SEXO”
ATRIBUTO: “IDADE”
ATRIBUTO: “PORTUGUÊS”
ATRIBUTO: “MATEMÁTICA”
TAREFA DE CLASSIFICAÇÃO: “CLASSIFY”
UTILIZAÇÃO DO ALGORITMO J48.
TAREFA DE CLUSTERIZAÇÃO: “CLUSTER”
UTILIZAÇÃO DO ALGORITMO SIMPLEKMEANS.
TAREFA DE CLUSTERIZAÇÃO: “CLUSTER”
UTILIZAÇÃO DO ALGORITMO SIMPLEKMEANS
TAREFA DE ASSOCIAÇÃO: “ASSOCIATE”
-UTILIZAÇÃO DO ALGORITMO APRIORI.
CONCLUSÕES
NA FAIXA DE NOTA >=60 E <80 EM PORTUGUÊS SÃO ENCONTRADOS 322 ALUNOS DO SEXO MASCULINO;
NA MESMA FAIXA DE NOTA, MAS EM MATEMÁTICA, SÃO ENCONTRADOS 262 ALUNOS DO SEXO MASCULINO;
PARA ALUNOS COM IDADE <25 E NOTAS >=60 E <80 EM PORTUGUÊS SÃO ENCONTRADOS 465 ALUNOS DE AMBOS OS SEXOS;
PARA A MESMA FAIXA DE IDADE E DE NOTA, MAS EM MATEMÁTICA, SÃO ENCONTRADOS 365 ALUNOS DE AMBOS OS SEXOS;
PARA O SEXO FEMININO E NOTAS NA FAIXA >=60 E <80 SÃO ENCONTRADOS 537 ALUNOS EM PORTUGUÊS; E
PARA A MESMA FAIXA DE IDADE E SEXO, MAS EM MATEMÁTICA, SÃO ENCONTRADOS 401 ALUNOS.
OBRIGADO!!!

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Continue navegando