Buscar

Mineração de Dados - Gabriel Lima

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

XXIV Congresso Brasileiro de Engenharia Biomédica – CBEB 2014��
� PAGE \* MERGEFORMAT �2��[Type the document title]��
II Jornada de Tecnologia do IESB – JornaTec 2015��
RELAÇÃO ENTRE VIDA PROFISSIONAL E VIDA PESSOAL, UTILIZANDO MINERAÇÃO DE DADOS
Gabriel Lima Gomes, Leticia T. M. Zoby
IESB, Brasília
e-mail: gabriel.lg08@gmail.com
�
Resumo: Nos últimos anos, dados coletados têm sido considerados muito valiosos para as organizações e vem crescendo cada vez mais rápido, porém se estes dados não são transformados em informações e interpretados de nada servirá. Para auxiliar na gestão de grande quantidade de dados, existe um recurso computacional para transformar esses dados em informações, o KDD (Knowledge Discovery in Database - Descoberta de conhecimento em base de dados). Este trabalho descreve um dos processos de KDD, a mineração de dados, através desse processo é possível extrair informações sobre a vida profissional e pessoal e relação entre elas, de uma base de dados gerada através de uma pesquisa. Foi utilizado o Cluster, uma das tarefas da mineração de dados, como foco do trabalho, combinando informações semelhantes entre as pessoas que responderam a pesquisa.
Palavras-chave: KDD, Mineração de dados, Cluster.
Abstract: In the last few years, the data collected have been very valuable for organization and it has been growing faster each day, therefore if this data is not transformed in information it will be a waste. To assist on a huge amount of data management there are computational resource to transform that data in information, the KDD (Knowledge Discovery in Database). This project describe one of the process of KDD, the data mining which is possible extract information about the professional life and personal life and relation between them of a data base built through a research. It was used cluster, one of the mining task data, as focus of the project, joining similar information between the people who answered the research.
Introdução
Qualidade de vida é um termo utilizado e muito estudado, pois está relacionado com doenças humanas. O estresse pode levar o homem ao esgotamento e ele não sabe como lidar com a situação. Esse estado de esgotamento é caracterizado como um estado de fadiga ou frustração, causada pela dedicação excessiva e prolongada a uma causa (LIPP, 1996). 
A sobrevivência dos seres humanos esta fundamentalmente ligada ao trabalho, pois a uma dedicação maior de sua vida, e em vários casos há mais convívio com os funcionários do que com a própria família (AMARO et al, 2015). 
Várias empresas utilizam a tecnologia com o objetivo de diminuir as perdas dos lucros e aumentar a produtividade, assim otimizam processos de tomadas de decisões e direcionam melhor o seu marketing e propaganda.
Devido a grande quantidade de dados coletados durante anos, a utilização do recurso de descoberta de conhecimento em base de dados tem contribuído na seleção de informações úteis as empresas. 
No contexto de gestão de pessoas, a mesma ferramenta que auxilia as empresa nas tomadas de decisões, por exemplo, em vendas e marketing, também servem de meio para os empresários e colaboradores melhorarem a qualidade de trabalho. Para isso, é necessário conhecer o perfil do quadro atual da equipe; monitorar possíveis interferências do ambiente de trabalho em sua vida pessoal e vice-versa; e descobrir os pontos que influência positivamente na vida profissional consequentemente aumentando a produtividade.
Neste trabalho foi realizado o processo de Mineração de Dados, que compõem uma das etapas do KDD (Knowledge Discovery in Databases, Descoberta de Conhecimento em Bancos de Dados), para auxiliar os gestores e/ou colaboradores na correlação do bem estar da vida pessoal e profissional. Desta forma os gestores e/ou colaboradores trabalhariam de maneira diferenciada, com capacitação do profissional e considera sua qualidade de vida, o que acarretaria em aumento da produtividade. 
Existem, diferentes tarefas no processo de KDD, o que determina a escolha da tarefa correta a ser usada é o objetivo e informações a serem descobertas pelo cliente. Para este trabalho foi escolhida a tarefa de Clusterização, onde cada cluster encontrado corresponde a um perfil de profissional. A definição do profissional é baseada em uma pesquisa realizada sobre a vida profissional e um teste de personalidade, possibilitando a descoberta de características comuns dos profissionais.
Revisão Bibliográfica
1 - Descoberta de conhecimento em bases de dados (KDD)
O processo de descoberta de conhecimento em bases de dados - Knowledge Discovery in Databases - KDD, segundo FAYYAD (SOUTO, 2012) é um processo de várias etapas, não trivial, interativo e iterativo, para identificação de padrões compreensíveis, válidos, novos e potencialmente úteis a partir de grandes conjuntos de dados. Este processo pode ajudar e/ou facilitar na formação de estratégias, por exemplo, na área de marketing, no aumento de lucratividade, auxilio na tomada de decisões entre outros. Possui no total de 5 etapas, que são: seleção, pré-processamento, transformação, mineração de dados e pós-processamento/interpretação do resultado.
1.1 - Mineração de dados
Mineração de dados (MD) é um processo que possibilita a descoberta de padrões relevantes em grande quantidade de dados, de forma automática ou semi-automática para informação previamente desconhecida. O uso desse processo tem por objetivo, melhorar o modo pelo qual lemos e interpretamos nossos dados existentes e futuros (DANTAS et. al, 2008). 
O deste processo deu inicio em meados da década de 90, quando as empresas tiveram condições de possuir poder de computação para processamento internamente, sem precisarem de recursos externos.
Com a grande quantidade de dados armazenados eletronicamente, com informações úteis e ocultas, a mineração de dados auxilia na previsão de um conhecimento futuro, indo além do armazenamento explicito dos dados, tornando-os em valiosas informações estratégicas (DANTAS et. al, 2008).
A MD possui diversas tarefas a qual deve ser selecionada de acordo com o que o usuário deseja, são elas: descoberta de associação, classificação, regressão, clusterização, sumarização, detecção de desvios (outliers) e descoberta de seqüências (SOUTO, 2012). Dentre essas tarefas citadas anteriormente, a clusterização, foi escolhida para este trabalho, pois consiste em formar grupos de objetos similares, tendo a vantagem de quando o conjunto de dados for definido e um padrão geral necessita ser determinado, possibilita criar inúmeros grupos de acordo com as necessidades do negócio. A desvantagem mais visível ao se utilizar essa tarefa é a necessidade do usuário saber de antemão quantos grupos são necessários criar, ou seja, necessita um conhecimento prévio do negócio (ALBERNETHY, 2010).
Para executar a tarefa de clusterização existe diferentes algoritmos a serem utilizados, dentre eles o k-means, o qual foi escolhido para este trabalho. Este algoritmo é o mais conhecido e utilizado para execução desse método, implementa o método de particionamento (SOUTO, 2012).
2 - Aplicação
As pessoas trabalham mais horas com o objetivo de atingir o sucesso profissional e recompensas materiais, e suas rotinas estão cada vez mais desgastantes. O bem estar físico e mental dos funcionários de uma empresa interfere na qualidade de vida no trabalho. É necessário que cada funcionário se sinta motivado e valorizado em relação ao desempenho de suas funções.
O estresse mental tem impacto não só na vida diária individual, mas também a nossa sociedade. Segundo Chiavenato (CHIAVENATO, 2004), os fatores que influenciam a qualidade de vida no trabalho são: satisfação na tarefa realizada, crescimento pessoal e profissional, reconhecimento nos trabalhos executados, salário e benefícios recebidos, liberdade e responsabilidade na tomada de decisões.
A partir do crescente desejo de se atingir a satisfação profissional, sem perder qualidade de vida,
uma pesquisa foi elaborada, com alguns pontos importantes que possibilitam analisar se estes profissionais estão conseguindo conciliar a vida profissional com o seu bem estar.
Relação entre a vida profissional e vida pessoal
Este trabalho propõe uma metodologia para a realização de um processo de descoberta de conhecimento em base de dados, fundamentado pela realização de um estudo de caso sobre vida pessoal e profissional.
Para implementar a base de dados a ser trabalhada, foi realizada uma pesquisa em âmbito nacional com total de 20 (vinte) perguntas, sendo 11 (onze) desenvolvidas especialmente para este trabalho. Sendo que essas perguntas envolvem o perfil pessoal e profissional como, sexo, estado, nível cargo atual, faixa salarial, benefícios recebidos no atual emprego, se houve progressão de cargo, progressão de salário, escolaridade, curso extra curricular, se realiza atividades físicas, horas livres por semana. As outras perguntas são de um teste de estresse do Serviço de Psicologia do Hospital do Coração- SPHC, na qual gera uma pontuação que possibilita analisar o nível de estresse do entrevistado que será determinado como, baixo nível de estresse, estresse médio, estresse alto e estresse muito alto. 
A pesquisa foi disponibilizada no período de 23/04/2015 e 30/06/2015, utilizando o recurso do Google Docs, o qual permite a criação de diferentes documentos. Os entrevistados responderam as perguntas de forma voluntária e o resultado desta, inicialmente, foi armazenado em uma planilha que o próprio do Google gera. A amostra investigada foi de 296 registros.
Após o término da disponibilidade da pesquisa, citado no item anterior, foi realizada uma extração da planilha para a base de dados escolhida. Após o armazenamento dos registros em um banco de dados relacional foi realizada a transformação e armazenamento dos registros selecionados e normalizados para uma tabela o qual foi realizado o processo de mineração de dados, este procedimento trata-se da fase de pré-processamento, mas por se tratar de uma base de dados pequena e nova a complexidade foi menor.
Após finalizar a preparação do conjunto de dados a ser utilizado, a mineração de dados foi aplicado utilizando o software Weka (WEKA, 2015).
Como dito anteriormente o método escolhido para a realização deste trabalho foi a de Cluster, dentro deste método existe diferente algoritmos para execução, o algoritmo Simple K-means, foi escolhido. Este algoritmo fornece uma classificação de informações de acordo com os próprios dados, baseada em análise e comparações entre os valores numéricos dos dados. O algoritmo fornece uma classificação automática sem a necessidade de supervisão humana ou uma pré-classificação existente (PICHILIANI, 2013).
Resultados e Discussão
Nesta seção serão apresentados alguns números da pesquisa e os resultados obtidos através do processo de mineração de dados.
Na figura 1 é apresentado o número de entrevistados do sexo masculino, em vermelho, com 197 respostas; e feminino com 99 repostas, em azul. Um total de 296 entrevistados.
Figura 1: Gráfico de quantidade de entrevistados por sexo.
É possível visualizar na figura 2 um gráfico com a quantidade de entrevistado em cada nível de estresse. No primeiro gráfico tem-se 118 pessoas com o nível de estresse médio e maioria são homens, no segundo gráfico são 176 pessoas com nível de estresse alto e também maior parte homens, já para o nível de estresse muito alto e baixo tem 1 para cada e ambos são homens.
Figura 2: Gráfico de quantidade de entrevistado em cada nível de estresse.
 Os resultados obtidos serão apresentados em forma de tabela com as seguintes colunas: coluna atributos o qual contém os dados que compõem cada cluster , colunas cluster 1, cluster 2, cluster 3 , contém o grupo que foi formado e a quantidade de cada grupo.
Na tabela 1 foi realizado o processo de MD com objetivo de identificar a influência do salário na vida pessoal dos profissionais.
Tabela 1: Nível de estresse de acordo com salário. 
	Atributo
	Cluster1(102)
	Cluster2(118)
	Cluster3(76)
	Sexo
	Feminino
	Masculino
	Masculino
	Nível Estresse
	Estresse Alto
	Estresse Alto
	Estresse Médio
	Salário
	Entre R$ 789 e R$ 1500
	Entre R$ 1501 e R$ 3000
	Entre R$5001 e R$ 10000
 
Com base no agrupamento realizado no cluster 1 mostrado na tabela 1, conclui-se que as mulheres que recebem um salário entre R$ 789 e R$ 1500 estão com um nível de estresse alto. Já no cluster 2 os homens também estão com um nível de estresse alto mas ganhando um salário entre R$ 1501 e R$ 3000. No cluster 3 foi formado um outro grupo de homens mas que ganham R$ 5000 e R$ 10000 e tem um nível de estresse médio, por ser considerado um salário relativamente bom, concluindo que estes profissionais tem um bom nível de sua vida pessoal com uma boa condição financeira.
No tabela 2 teve como objetivo identificar a influência de não obter alguma progressão salarial e/ou de cargo pode ter na vida pessoal do profissional, assim elevando o nível de estresse.
Tabela 2: Influência de uma progressão de cargo e/ou salário na vida pessoal. 
	Atributo
	Cluster1(70)
	Cluster2(135)
	Cluster3(91)
	Curso Extra
	Não
	Sim
	Sim
	Nível Estresse
	Estresse Alto
	Estresse Alto
	Estresse Médio
	Progressão de Cargo
	Não Houve
	Não Houve
	Últimos 18 meses
Na tabela 2, observa-se no cluster 1 os profissionais que não possuem cursos extras e não obtiveram aumento de salário e nem algum tipo de progressão de função, estão com um nível de estresse alto. Já no cluster 2, mesmo possuindo curso extra os profissionais que não obtiveram aumento salário e nem progressão de cargo também estão com um nível de estresse alto. Já no cluster 3 os profissionais que obtiveram aumento salarial ou progressão de cargo estão com um nível de estresse médio. Conclui-se que a satisfação profissional pode interferir diretamente na vida pessoal do colaborador sendo com algum beneficio salarial e/ou atribuições.
O terceiro objetivo estabelecido na tabela 3 foi identificar a influência que um curso extra tem para progressão de cargo e valor do salário.
Tabela 3: Influência de cursos na vida profissional.
	Atributo
	Cluster1(87)
	Cluster2(140)
	Cluster3(69)
	Curso Extra
	Não
	Sim
	Sim
	Progressão de Cargo
	Não houve
	Não houve
	Últimos 18 meses
	Salário
	Até R$ 788
	Entre R$1501 e R$ 3000
	Entre R$5001 e R$10000
	Escolaridade
	Nível Superior
	Nível Superior
	Nível Superior
Com base no agrupamento da tabela 3, no cluster 1 pode-se concluir que os profissionais que não possuem algum tipo de curso extra não obtiveram alguma promoção de cargo e recebem um salário de até R$ 788 mesmo possuindo alguma graduação. Já no cluster 2 os profissionais que possuem algum tipo de curso mesmo não havendo progressão de cargo possuem um salário melhor do que os profissionais do cluster 1. No cluster 3, conclui-se que os profissionais que possuem algum curso obtiveram progressão de cargo e recebem um salário melhor do que os profissionais dos 2 grupos anteriores mesmo possuindo o mesmo nível de escolaridade. O que pode-se concluir que cursos complementares pode influenciar tanto no salário como nas futuras promoções de cargos. 
Conclusão
Ter informações tornou-se uma necessidade e um ponto importante para as organizações, o que pode fazer a diferença quando se trata de competitividade no mercado. O aumento cada vez mais rápido do volume de dados armazenados pode ocultar valiosas informações para alguns processos de tomada de decisão. Uma solução para este problema é aplicar o processo de KDD.
Foi demonstrado neste trabalho a execução do processo de KDD proposto para atender a 3 (três) objetivos, nível de estresse de acordo com salário, influência de uma progressão de cargo e/ou salário na vida pessoal, influência de cursos na vida profissional, assim gerando um resultado para cada, contendo entre 3 (três) e 4(quatro) atributos, que representam
as características em comum entre os profissionais que responderam o questionário disponibilizado. É possível observar que os profissionais que continuam se capacitando com cursos extras tendem a ter uma melhoria em seu salário e/ou progressão de cargo. Outra característica identificada foi a do nível de estresse médio que é caracterizado por profissionais que obtiveram alguma progressão no salário e/ou cargo e ganham um salário relativamente bom.
A identificação destas características fornece subsídios para a compreensão dos perfis dos profissionais existentes no mercado, para que as empresas e/ou os profissionais tomem qualquer medida para realizarem algumas mudanças.
O processo de KDD é um poderoso método que pode auxiliar as organizações em diversas áreas, mesmo aparentando ser um processo fácil de ser realizado é um método complexo principalmente em bases de dados grandes, havendo erros no processo inicial pode prejudicar o restante do processo e gerando informações erradas, o que pode acarretar em diversas conseqüências, principalmente em grandes companhias.
Agradecimentos
Os autores gostariam de agradecer ao Centro Universitário IESB pelo projeto de Iniciação Científica e ao CNPq pelo suporte financeiro com a bolsa CNPq/FUNTEL. 
Referências
Albernethy, Michael. 2010. Mineração de dados com WEK. Acessado em 01 de junho de 2015. Disponível em: http://www.ibm.com/developerworks/br/opensource/library/os-weka1/ .
Chiavenato, Idalberto. 2004. Gestão de Pessoas: Segunda Edição, Totalmente Revisada e Atualizada. 2 ed. Rio de Janeiro: Elsevier.
Damasceno, Marcelo. 2010. Congresso de Pesquisa e Inovação da Rede Norte Nordeste de Educação Tecnológica. Introdução a mineração de dados utilizando o weka. Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte.
Dantas, Eric Rommel G.. Almeida, José Carlos. Patrício, Júnior. de Lima, Daniel Silva. Azevedo, Ryan Ribeiro. 2008. SEGet - Simpósio de Excelência em Gestão e Tecnologia. O Uso da Descoberta de Conhecimento em Base de Dados para Apoiar a Tomada de Decisões. Centro Universitário de João Pessoa - UNIPÊ.
Pichiliani, Mauro. 2013. Devmedia. Data Mining na Prática: Algoritmo K-Means. Acessado em 20 de julho de 2015. Disponível em: http://www.devmedia.com.br/data-mining-na-pratica-algoritmo-k-means/4584.
Souto, Liziane Priscila Marques. 2012. Encontro Nacional de Educação, Ciência e Tecnologia/UEPB. Aplicação de Mineração de dados para Levantamento de Perfis: Estudo de caso em uma Instituição de Ensino Superior Privada (FACISA - Faculdade de Ciências Sociais e Aplicadas).
LIPP, M. E. N. 1996. Pesquisas sobre stress no Brasil: saúde,ocupações e grupo de risco. Campinas: Papirus, 1996.
Amaro, K. et all. 2015. STRESS NAS ORGANIZAÇÕES: UM ESTUDO DE CASO DE UMA EMPRESA DE CALL CENTER. Revista Gestão Contemporânea. Vila Velha v. 5, n.1, p.135-152.
WEKA. 2015. Disponivel em: http://www.cs.waikato.ac.nz/ml/weka/downloading.html. Acessado em: 01 de junho 2015.
�PAGE �
�PAGE �2�

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Continue navegando

Outros materiais