Buscar

O Uso da Mineração de Dados na Área de Saúde

Prévia do material em texto

O Uso da Mineração de Dados na Área de Saúde 
Artur Pasetto ​1​,​ Thiago Borges Vieira​2 
Instituto Federal Catarinense​ ( ​IFC​) 
Caixa Postal ​89560-000 ​– ​Videira - SC - Brasil 
artur5pasetto@gmail.com,thyagoborges.v@gmail.com 
Abstract. ​We present this article the adversity of the great amount of                       
information on the internet, causing people to not find data. This mode, we                         
bring data mining as a solution to these complications, highlighting examples                     
of how it was used. 
Resumo. ​Apresentamos neste artigo a adversidade da grande quantidade de                   
informações na internet, fazendo com que muitas vezes não encontramos                   
dados adequados. Deste modo, trazemos a mineração de dados como uma                     
possível solução para essas complicações, destacando exemplos de como ela                   
foi utilizada. 
 
1. Introdução 
A enorme quantidade crescente de dados, coletados e armazenados em grandes e 
numerosos repositórios de dados, excedeu em muito nossa capacidade humana de 
abstração sem técnicas. Com base nessa afirmação, podemos concluir que, existem 
obstáculos ao tentar encontrar dados congruentes. (HAN; KAMBER; PEI, 2012) 
Consequentemente, o uso de mineração de dados resulta como uma elucidação 
para essa adversidade. Aliás, Galvão e Marin (2009) apontam que “isso provavelmente 
acontece em decorrência de um ritmo alucinante de geração de dados, o que produz uma 
incapacidade natural no ser humano de explorar, extrair e interpretar estes dados para 
obter conhecimento dessas bases”. 
Para manipular esse grande volume de dados, utiliza-se uma prática conhecida 
como mineração de dados, que é caracterizado como um processo que encontra um 
pequeno conjunto relacionado pertinente à algo de um grande volume de dados 
(HAN;KAMBER;PEI, 2012). 
 
2. Desenvolvimento 
2.1 Mineração de dados 
Tomamos como exemplo, que várias pessoas buscaram algumas peças de computador 
em uma loja ​online​. Por coincidência, várias pessoas que compraram processadores 
caros, acabaram comprando placa-mães com preço menor. Para entendermos o vínculo 
entre os produtos, Han, Kamber e Pei (2012, p.403) apontam que “mineração de dados 
descobre relacionamentos desse tipo. Os relacionamentos podem estar entre dois ou 
mais objetos diferentes junto com a dimensão de tempo”. 
A mineração de dados utiliza-se de técnicas para tal, não apenas como 
classificação, ​clustering ​bem como direcionada e não direcionada. A mineração 
direcionada categoriza algum alvo específico enquanto a mineração de dados não 
direcionada encontra semelhanças entre grupos sem predefinições (BERRY; LINOFF, 
2014). Um dos exemplos de mineração direcionada é a classificação e de mineração não 
direcionada é o ​clustering​. 
A seguir serão apresentados alguns métodos utilizados pela mineração de dados. 
2.1.1 Classificação 
A Classificação, como o nome já indica, é classificar dados. Portanto, esse processo 
analisa os dados que já contém uma classificação para “aprender” a classificar novos 
registros (GALVÃO; MARIN, 2001). Em suma, a tarefa é construir um modelo de 
algum tipo que pode ser aplicado a dados não classificados, a fim de classificá-lo 
(BERRY; LINOFF, 2014). 
A classificação pode ser utilizada para diagnosticar doenças, indicar um aluno 
para uma turma, uma fraude de transação de um cartão e outros fins (CAMILO; SILVA, 
2009). Sob o mesmo ponto de vista de sua utilização, Camilo e Silva (2009, p. 12) 
apontam: “um laboratório pode usar sua base histórica de voluntários e verificar em 
quais indivíduos uma nova droga pode ser melhor administrada”. 
2.1.2 ​Clustering 
Uma das técnicas de mineração de dados é ​clustering ​ou agrupamento, um processo que 
visa agrupar os dados em categorias por suas similaridades entre eles, ou seja, quantos 
mais os dados ficam semelhantes em relação à outro, são designados em um grupo. 
Consequentemente, os grupos tornam-se homogêneos em seu universo, porém, 
heterogêneos entre si (CORTÊS; PORCARO; LIFSCHITZ, 2002). 
Em virtude disso, mercados melhoram seus ganhos reorganizando as prateleiras 
com base na descoberta (PONNIAH, 2001). Além do mais, Camilo e Silva (2009, p. 10) 
ressaltam: 
“As aplicações das tarefas de agrupamento são as mais variadas possíveis: 
pesquisa de mercado, reconhecimento de padrões, processamento de 
imagens, análise de dados, segmentação de mercado, taxonomia de plantas e 
animais, pesquisas geográficas, classificação de documentos da Web, 
detecção de comportamentos atípicos (fraudes), entre outras”. 
2.1.3 Associação 
A regra de associação “consiste em identificar quais atributos estão relacionados. 
Apresentam a forma: SE atributo X ENTÃO atributo Y” (CAMILO; SILVA, 2009, p. 
10). Normalmente as regras de associação são aplicadas quando se quer explorar 
afinidades ou preferências. Por exemplo, quando dois produtos que são comprados 
juntos, podem ser criados “pacotes” para os clientes, que contenham estes dois produtos 
(CORTÊS; PORCARO; LIFSCHITZ, 2002). 
2.2 A Área de Saúde 
Sob o mesmo ponto de vista dito anteriormente, a quantidade de informações sobre 
saúde pode acabar em um diagnóstico errado, aliás, “[...] 85% da amostra disseram 
utilizar mecanismos de busca como Yahoo, Cadê e Google para pesquisar questões 
relacionadas com saúde e medicamentos [...]” segundo Moretti, Oliveira e Silva (2012). 
Assim sendo, a mineração de dados destaca-se no setor da saúde por suas 
aplicabilidades em “análise da eficácia de certos tratamentos, a otimização de processos 
dentro de um hospital, o relacionamento de dados sobre o estado de saúde do paciente 
com a qualificação médica; e a análise de efeitos colaterais de drogas” que CORTÊS, 
PORCARO, LIFSCHITZ (2002, p. 33) destacam. Além disso, salientam que “diversos 
aparelhos de diagnósticos estão sendo desenvolvidos segundo os padrões encontrados 
em populações observadas ao longo de vários anos. Seu objetivo é detectar e identificar, 
principalmente, grupo de riscos para os pacientes e trabalhar na prevenção de possíveis 
doenças” (CORTÊS; PORCARO; LIFSCHITZ, 2002, p. 33). 
2.2.1 Hipertensão 
A KMIC (​The Korea Medical Insurance Corporation​) utilizou-se da mineração de 
dados na área de saúde, fazendo exames de hipertensão em todos os funcionários do 
serviço civil, professores e seus dependente. Dados como pressão arterial, colesterol, 
altura e peso, foram coletados durante o exame físico (CHAE et al., 2001). 
Segundo CHAE et al (2001), “[...] a regra de associação foi usada para 
identificar a relação de ocorrência entre a hipertensão e vários fatores de risco 
modificáveis, como fumar ou beber”. Abaixo são mostrados exemplos de como a regra 
de associação foi utilizada no programa de controle de hipertensão da KMIC (CHAE et 
al, 2001): 
Se o exercício = não e (43 < idade < 48) e sexo = feminino, então a probabilidade de 
hipertensão é de 21%. 
Se o exercício = não e fumar = sim e beber = sim, então a probabilidade de hipertensãoé de 26%. 
Em resumo, “[...] a regra de associação mostrou que a existência de todos os três 
fatores de risco modificáveis ​​(fumo, bebida e exercício) aumentou significativamente a 
probabilidade de hipertensão, independentemente do sexo” (CHAE et al, 2001). 
2.2.2 Mortalidade Infantil 
Em uma pesquisa realizada pelo Comitê Estadual de Prevenção da Mortalidade 
Infantil ocorreram 9372 óbitos infantis, que destes, foram analisados 7256 (VIANNA et 
al., 2010). Devido a isso, VIANNA et al. Realizaram um estudo a fim de identificar 
alguns padrões na predição da mortalidade infantil através do uso do ​Data Mining. 
Desse modo, foi elaborada uma uma base de dados com diversos óbitos infantis 
que foram analisados por Comitês de prevenção da Mortalidade Infantil entre 2000 e 
2004. Assim, foi usado a mineração para fazer uma busca no banco de dados que 
gerasse regras que eram analisadas e transformadas em informação útil. 
Após a mineração, foram selecionadas 4.230 regras. Desta forma, um exemplo 
de regra pode ser conferido logo abaixo: 
Se mãe adolescente e peso ao nascer < 2.500g, ou parto pós-termo e mãe 
adolescente com outro filho, ou com afecções maternas. Então o risco para óbito 
neonatal é maior. 
Com isso, foi vista a necessidade de estabelecer maior atenção às adolescentes, 
às crianças com peso ao nascer < 2.500g, pós-termo e filhas de mães com afecções 
maternas (VIANNA et al., 2010). 
2.3 Outras Áreas 
2.3.1 Web Mining 
“O ​web mining agrupa, em três diferentes abordagens [...]. Essas abordagens são a 
mineração de conteúdo (​web content mining​), a mineração de estrutura (​web structure 
mining ​) e a mineração de uso (​web usage mining​) [...]” (KIPPES, 2010, p. 26). 
A mineração de estrutura da web é voltada para a análise de domínios de sites na 
internet, visando explorar as conexões de um site na internet. Por outro lado, a 
mineração de uso é voltada para a reação dos usuários navegando em um site, 
realizando um registro. Nesse sentido, esses registros podem ajudar na estrutura do site 
(KIPPES, 2010). 
Conforme dito anteriormente, a mineração de dados é lidar com uma grande 
massa de dados, sejam elas comerciais, educacionais, informações de clientes, etc; 
portanto, ao tratarmos de dados na Web dizemos que “[...] é a aplicação de técnicas de 
mineração de dados para descobrir padrões, estruturas e conhecimento da Web.” (HAN; 
KAMBER; PEI, 2001, p.597). 
Associando o uso de web mining ​com o exemplo da compra de processadores e 
placa-mães, este pode por fim, promover a compra de produtos de diversos grupos no 
mesmo tempo, além de melhorar a eficiência e qualidade dos serviços (HAN; 
KAMBER; PEI, 2012). Além do exemplo anterior, podemos adentrar na área financeira 
com detecção de fraudes, previsão de preços de ​commodities ​até mesmo previsão de 
desastre financeiro (PONNIAH, 2001). 
Um dos exemplos que ressaltamos do uso de mineração de dados na área 
financeira foi quando o Bank of America usou técnicas para prever clientes com menos 
riscos de calote, concedendo-lhes linhas de créditos, lucrando 30 milhões de dólares 
(VELOSO et al., 2011). 
2.3.1 Informações na Internet 
A internet colaborou com a divulgação e busca de informações de diversas fontes, 
entretanto, com o grande crescimento de informações Moretti, Oliveira e Silva (2012) 
apontam que “[...] se por um lado existe a facilidade de encontrar todo tipo de 
informação na internet, por outro há dificuldade de se atingir informações seguras, visto 
que a quantidade de dados dificulta a localização de uma fonte confiável”. 
2.3.2 E-commerce 
A mineração de dados não só está inserida na área de saúde, como também em sistemas 
de recomendações na internet. Por exemplo, em sites de e-commerce com suas 
recomendações para os usuários, que são baseadas nas compras anteriores ou nas 
navegações entre os produtos (BÜCHNER; MULVENNA, 1998). 
Da mesma forma que a mineração de dados descobre padrões para 
recomendações, um de seus outros usos é a atração ou seleção de novos clientes. Uma 
das técnicas é usar como parâmetros outros usuários que já visitaram o site para criar 
regras de marketing e aplicar aos novos visitantes. Dessa forma, a regra pode ser 
utilizada para a criação de ofertas especiais dependendo do tempo que o usuário passou 
em sites de compras (BÜCHNER; MULVENNA, 1998). 
 3. Conclusão 
Em virtude dos fatos mencionados, podemos afirmar que a mineração de dados nos 
ajuda em vários aspectos, tanto quanto na área e-commerce e saúde. Por meio da 
mineração e seu método de associação, a KMIC obteve resultados de como fumar, 
beber e não fazer exercício físico aumentam a probabilidade de hipertensão. Além do 
mais, o Comitê Estadual de Prevenção da Mortalidade Infantil também obteve 
resultados para predição de mortalidade infantil. 
 
 
Referências 
BERRY, Michael J.A.; LINOFF, Gordon S. ​Data Mining Techniques: For 
Marketing, Sales, and Customer Relationship Management​. 2. ed. Indianapolis: 
Wiley Publishing, Inc, 2014. 
BÜCHNER, Alex G.; MULVENNA, Maurice D.. Discovering Internet marketing 
intelligence through online analytical web usage mining. ​Acm Sigmod Record​, New 
York, v. 27, n. 4, p.54-61, dez. 1998. Association for Computing Machinery (ACM). 
http://dx.doi.org/10.1145/306101.306124. 
CAMILO, Cássio Oliveira; SILVA, João Carlos da. ​Mineração de dados: Conceitos, 
Tarefas, Métodos e Ferramentas ​. 2009. 28 f. Dissertação (Mestrado) - Curso de 
Ciência da Computação, Universidade Federal de Goiás, Goiás, 2009. 
CHAE, Young Moon et al. Data mining approach to policy analysis in a health 
insurance domain. ​International Journal Of Medical Informatics ​, v. 62, n. 2-3, 
p.103-111, jul. 2001. Elsevier BV. 
http://dx.doi.org/10.1016/s1386-5056(01)00154-x. 
CORTÊS, Sérgio da Costa; PORCARO, Rosa Maria; LIFSCHITZ, Sérgio. ​Mineração 
de dados - Funcionalidades, Técnicas e Abordagens​. Rio de Janeiro: Puc-rio, 
2002. 
GALVAO, Noemi Dreyer and MARIN, Heimar de Fátima. ​Técnica de mineração de 
dados: uma revisão da literatura ​. Acta paul. enferm. [online]. 2009, vol.22, n.5, 
pp.686-690. ISSN 0103-2100. 
http://dx.doi.org/10.1590/S0103-21002009000500014. 
HAN, Jiawey; KAMBER, Micheline; PEI, Jian. ​Data Mining ​: ​Concepts and 
Techniques​. 3. ed. Waltham: Elsevier Inc, 2012. 740 p. 
KIPPES, Alexander. ​Mineração de dados e análise do comportamento do 
consumidor: Estudo de caso em um website de ensino a distância​. 2010. 116 f. 
Dissertação (Mestrado) - Curso de Administração, Universidade Federal de Lavras, 
Lavras, 2010. 
PONNIAH, P. Data Warehousing Fundamentals: A Comprehensive Guide for IT 
Professionals​. John Wiley and Sons, Inc, 2001. 
MORETTI, Felipe Azevedo; OLIVEIRA, Vanessa Elias de; SILVA, Edina Mariko 
Koga da. Acesso a informações de saúde na internet: uma questão de saúde pública?. 
Revista da Associação Médica Brasileira​, São Paulo, v. 58, n. 6, p.650-658, nov.2012. Elsevier BV. http://dx.doi.org/10.1590/s0104-42302012000600008. 
VELOSO, Flávio Henrique da Silva et al. DATA MINING, SEUS BENEFÍCIOS, 
UTILIZAÇÕES, METODOLOGIA, CAMPO DE ATUAÇÃO DENTRO DE 
GRANDES E PEQUENAS EMPRESAS. ​Revista Eletrônica de Sistemas de 
Informação e Gestão Tecnológica​, Franca, v. 1, n. 1, p.45-53, 2011​. 
VIANNA, Rossana Cristina Xavier Ferreira et al. Mineração de dados e características 
da mortalidade infantil. ​Cad. Saúde Pública [online]. 2010, vol.26, n.3, pp.535-542. 
ISSN 0102-311X. http://dx.doi.org/10.1590/S0102-311X2010000300011.

Continue navegando