O Uso da Mineração de Dados na Área de Saúde

•

UNINTER

4

0

4

0

Thiago Borges Vieira

02/02/2019

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Banco de Dados I

28.115 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

O Uso da Mineração de Dados na Área de Saúde
Artur Pasetto 1, Thiago Borges Vieira2
Instituto Federal Catarinense ( IFC)
Caixa Postal 89560-000 – Videira - SC - Brasil
artur5pasetto@gmail.com,thyagoborges.v@gmail.com
Abstract. We present this article the adversity of the great amount of
information on the internet, causing people to not find data. This mode, we
bring data mining as a solution to these complications, highlighting examples
of how it was used.
Resumo. Apresentamos neste artigo a adversidade da grande quantidade de
informações na internet, fazendo com que muitas vezes não encontramos
dados adequados. Deste modo, trazemos a mineração de dados como uma
possível solução para essas complicações, destacando exemplos de como ela
foi utilizada.
1. Introdução
A enorme quantidade crescente de dados, coletados e armazenados em grandes e
numerosos repositórios de dados, excedeu em muito nossa capacidade humana de
abstração sem técnicas. Com base nessa afirmação, podemos concluir que, existem
obstáculos ao tentar encontrar dados congruentes. (HAN; KAMBER; PEI, 2012)
Consequentemente, o uso de mineração de dados resulta como uma elucidação
para essa adversidade. Aliás, Galvão e Marin (2009) apontam que “isso provavelmente
acontece em decorrência de um ritmo alucinante de geração de dados, o que produz uma
incapacidade natural no ser humano de explorar, extrair e interpretar estes dados para
obter conhecimento dessas bases”.
Para manipular esse grande volume de dados, utiliza-se uma prática conhecida
como mineração de dados, que é caracterizado como um processo que encontra um
pequeno conjunto relacionado pertinente à algo de um grande volume de dados
(HAN;KAMBER;PEI, 2012).

2. Desenvolvimento
2.1 Mineração de dados
Tomamos como exemplo, que várias pessoas buscaram algumas peças de computador
em uma loja online. Por coincidência, várias pessoas que compraram processadores
caros, acabaram comprando placa-mães com preço menor. Para entendermos o vínculo
entre os produtos, Han, Kamber e Pei (2012, p.403) apontam que “mineração de dados
descobre relacionamentos desse tipo. Os relacionamentos podem estar entre dois ou
mais objetos diferentes junto com a dimensão de tempo”.
A mineração de dados utiliza-se de técnicas para tal, não apenas como
classificação, clustering bem como direcionada e não direcionada. A mineração
direcionada categoriza algum alvo específico enquanto a mineração de dados não
direcionada encontra semelhanças entre grupos sem predefinições (BERRY; LINOFF,
2014). Um dos exemplos de mineração direcionada é a classificação e de mineração não
direcionada é o clustering.
A seguir serão apresentados alguns métodos utilizados pela mineração de dados.
2.1.1 Classificação
A Classificação, como o nome já indica, é classificar dados. Portanto, esse processo
analisa os dados que já contém uma classificação para “aprender” a classificar novos
registros (GALVÃO; MARIN, 2001). Em suma, a tarefa é construir um modelo de
algum tipo que pode ser aplicado a dados não classificados, a fim de classificá-lo
(BERRY; LINOFF, 2014).
A classificação pode ser utilizada para diagnosticar doenças, indicar um aluno
para uma turma, uma fraude de transação de um cartão e outros fins (CAMILO; SILVA,
2009). Sob o mesmo ponto de vista de sua utilização, Camilo e Silva (2009, p. 12)
apontam: “um laboratório pode usar sua base histórica de voluntários e verificar em
quais indivíduos uma nova droga pode ser melhor administrada”.
2.1.2 Clustering
Uma das técnicas de mineração de dados é clustering ou agrupamento, um processo que
visa agrupar os dados em categorias por suas similaridades entre eles, ou seja, quantos
mais os dados ficam semelhantes em relação à outro, são designados em um grupo.
Consequentemente, os grupos tornam-se homogêneos em seu universo, porém,
heterogêneos entre si (CORTÊS; PORCARO; LIFSCHITZ, 2002).
Em virtude disso, mercados melhoram seus ganhos reorganizando as prateleiras
com base na descoberta (PONNIAH, 2001). Além do mais, Camilo e Silva (2009, p. 10)
ressaltam:
“As aplicações das tarefas de agrupamento são as mais variadas possíveis:
pesquisa de mercado, reconhecimento de padrões, processamento de
imagens, análise de dados, segmentação de mercado, taxonomia de plantas e
animais, pesquisas geográficas, classificação de documentos da Web,
detecção de comportamentos atípicos (fraudes), entre outras”.
2.1.3 Associação
A regra de associação “consiste em identificar quais atributos estão relacionados.
Apresentam a forma: SE atributo X ENTÃO atributo Y” (CAMILO; SILVA, 2009, p.
10). Normalmente as regras de associação são aplicadas quando se quer explorar
afinidades ou preferências. Por exemplo, quando dois produtos que são comprados
juntos, podem ser criados “pacotes” para os clientes, que contenham estes dois produtos
(CORTÊS; PORCARO; LIFSCHITZ, 2002).
2.2 A Área de Saúde
Sob o mesmo ponto de vista dito anteriormente, a quantidade de informações sobre
saúde pode acabar em um diagnóstico errado, aliás, “[...] 85% da amostra disseram
utilizar mecanismos de busca como Yahoo, Cadê e Google para pesquisar questões
relacionadas com saúde e medicamentos [...]” segundo Moretti, Oliveira e Silva (2012).
Assim sendo, a mineração de dados destaca-se no setor da saúde por suas
aplicabilidades em “análise da eficácia de certos tratamentos, a otimização de processos
dentro de um hospital, o relacionamento de dados sobre o estado de saúde do paciente
com a qualificação médica; e a análise de efeitos colaterais de drogas” que CORTÊS,
PORCARO, LIFSCHITZ (2002, p. 33) destacam. Além disso, salientam que “diversos
aparelhos de diagnósticos estão sendo desenvolvidos segundo os padrões encontrados
em populações observadas ao longo de vários anos. Seu objetivo é detectar e identificar,
principalmente, grupo de riscos para os pacientes e trabalhar na prevenção de possíveis
doenças” (CORTÊS; PORCARO; LIFSCHITZ, 2002, p. 33).
2.2.1 Hipertensão
A KMIC (The Korea Medical Insurance Corporation) utilizou-se da mineração de
dados na área de saúde, fazendo exames de hipertensão em todos os funcionários do
serviço civil, professores e seus dependente. Dados como pressão arterial, colesterol,
altura e peso, foram coletados durante o exame físico (CHAE et al., 2001).
Segundo CHAE et al (2001), “[...] a regra de associação foi usada para
identificar a relação de ocorrência entre a hipertensão e vários fatores de risco
modificáveis, como fumar ou beber”. Abaixo são mostrados exemplos de como a regra
de associação foi utilizada no programa de controle de hipertensão da KMIC (CHAE et
al, 2001):
Se o exercício = não e (43 < idade < 48) e sexo = feminino, então a probabilidade de
hipertensão é de 21%.
Se o exercício = não e fumar = sim e beber = sim, então a probabilidade de hipertensãoé de 26%.
Em resumo, “[...] a regra de associação mostrou que a existência de todos os três
fatores de risco modificáveis (fumo, bebida e exercício) aumentou significativamente a
probabilidade de hipertensão, independentemente do sexo” (CHAE et al, 2001).
2.2.2 Mortalidade Infantil
Em uma pesquisa realizada pelo Comitê Estadual de Prevenção da Mortalidade
Infantil ocorreram 9372 óbitos infantis, que destes, foram analisados 7256 (VIANNA et
al., 2010). Devido a isso, VIANNA et al. Realizaram um estudo a fim de identificar
alguns padrões na predição da mortalidade infantil através do uso do Data Mining.
Desse modo, foi elaborada uma uma base de dados com diversos óbitos infantis
que foram analisados por Comitês de prevenção da Mortalidade Infantil entre 2000 e
2004. Assim, foi usado a mineração para fazer uma busca no banco de dados que
gerasse regras que eram analisadas e transformadas em informação útil.
Após a mineração, foram selecionadas 4.230 regras. Desta forma, um exemplo
de regra pode ser conferido logo abaixo:
Se mãe adolescente e peso ao nascer < 2.500g, ou parto pós-termo e mãe
adolescente com outro filho, ou com afecções maternas. Então o risco para óbito
neonatal é maior.
Com isso, foi vista a necessidade de estabelecer maior atenção às adolescentes,
às crianças com peso ao nascer < 2.500g, pós-termo e filhas de mães com afecções
maternas (VIANNA et al., 2010).
2.3 Outras Áreas
2.3.1 Web Mining
“O web mining agrupa, em três diferentes abordagens [...]. Essas abordagens são a
mineração de conteúdo (web content mining), a mineração de estrutura (web structure
mining ) e a mineração de uso (web usage mining) [...]” (KIPPES, 2010, p. 26).
A mineração de estrutura da web é voltada para a análise de domínios de sites na
internet, visando explorar as conexões de um site na internet. Por outro lado, a
mineração de uso é voltada para a reação dos usuários navegando em um site,
realizando um registro. Nesse sentido, esses registros podem ajudar na estrutura do site
(KIPPES, 2010).
Conforme dito anteriormente, a mineração de dados é lidar com uma grande
massa de dados, sejam elas comerciais, educacionais, informações de clientes, etc;
portanto, ao tratarmos de dados na Web dizemos que “[...] é a aplicação de técnicas de
mineração de dados para descobrir padrões, estruturas e conhecimento da Web.” (HAN;
KAMBER; PEI, 2001, p.597).
Associando o uso de web mining com o exemplo da compra de processadores e
placa-mães, este pode por fim, promover a compra de produtos de diversos grupos no
mesmo tempo, além de melhorar a eficiência e qualidade dos serviços (HAN;
KAMBER; PEI, 2012). Além do exemplo anterior, podemos adentrar na área financeira
com detecção de fraudes, previsão de preços de commodities até mesmo previsão de
desastre financeiro (PONNIAH, 2001).
Um dos exemplos que ressaltamos do uso de mineração de dados na área
financeira foi quando o Bank of America usou técnicas para prever clientes com menos
riscos de calote, concedendo-lhes linhas de créditos, lucrando 30 milhões de dólares
(VELOSO et al., 2011).
2.3.1 Informações na Internet
A internet colaborou com a divulgação e busca de informações de diversas fontes,
entretanto, com o grande crescimento de informações Moretti, Oliveira e Silva (2012)
apontam que “[...] se por um lado existe a facilidade de encontrar todo tipo de
informação na internet, por outro há dificuldade de se atingir informações seguras, visto
que a quantidade de dados dificulta a localização de uma fonte confiável”.
2.3.2 E-commerce
A mineração de dados não só está inserida na área de saúde, como também em sistemas
de recomendações na internet. Por exemplo, em sites de e-commerce com suas
recomendações para os usuários, que são baseadas nas compras anteriores ou nas
navegações entre os produtos (BÜCHNER; MULVENNA, 1998).
Da mesma forma que a mineração de dados descobre padrões para
recomendações, um de seus outros usos é a atração ou seleção de novos clientes. Uma
das técnicas é usar como parâmetros outros usuários que já visitaram o site para criar
regras de marketing e aplicar aos novos visitantes. Dessa forma, a regra pode ser
utilizada para a criação de ofertas especiais dependendo do tempo que o usuário passou
em sites de compras (BÜCHNER; MULVENNA, 1998).
3. Conclusão
Em virtude dos fatos mencionados, podemos afirmar que a mineração de dados nos
ajuda em vários aspectos, tanto quanto na área e-commerce e saúde. Por meio da
mineração e seu método de associação, a KMIC obteve resultados de como fumar,
beber e não fazer exercício físico aumentam a probabilidade de hipertensão. Além do
mais, o Comitê Estadual de Prevenção da Mortalidade Infantil também obteve
resultados para predição de mortalidade infantil.

Referências
BERRY, Michael J.A.; LINOFF, Gordon S. Data Mining Techniques: For
Marketing, Sales, and Customer Relationship Management. 2. ed. Indianapolis:
Wiley Publishing, Inc, 2014.
BÜCHNER, Alex G.; MULVENNA, Maurice D.. Discovering Internet marketing
intelligence through online analytical web usage mining. Acm Sigmod Record, New
York, v. 27, n. 4, p.54-61, dez. 1998. Association for Computing Machinery (ACM).
http://dx.doi.org/10.1145/306101.306124.
CAMILO, Cássio Oliveira; SILVA, João Carlos da. Mineração de dados: Conceitos,
Tarefas, Métodos e Ferramentas . 2009. 28 f. Dissertação (Mestrado) - Curso de
Ciência da Computação, Universidade Federal de Goiás, Goiás, 2009.
CHAE, Young Moon et al. Data mining approach to policy analysis in a health
insurance domain. International Journal Of Medical Informatics , v. 62, n. 2-3,
p.103-111, jul. 2001. Elsevier BV.
http://dx.doi.org/10.1016/s1386-5056(01)00154-x.
CORTÊS, Sérgio da Costa; PORCARO, Rosa Maria; LIFSCHITZ, Sérgio. Mineração
de dados - Funcionalidades, Técnicas e Abordagens. Rio de Janeiro: Puc-rio,
2002.
GALVAO, Noemi Dreyer and MARIN, Heimar de Fátima. Técnica de mineração de
dados: uma revisão da literatura . Acta paul. enferm. [online]. 2009, vol.22, n.5,
pp.686-690. ISSN 0103-2100.
http://dx.doi.org/10.1590/S0103-21002009000500014.
HAN, Jiawey; KAMBER, Micheline; PEI, Jian. Data Mining : Concepts and
Techniques. 3. ed. Waltham: Elsevier Inc, 2012. 740 p.
KIPPES, Alexander. Mineração de dados e análise do comportamento do
consumidor: Estudo de caso em um website de ensino a distância. 2010. 116 f.
Dissertação (Mestrado) - Curso de Administração, Universidade Federal de Lavras,
Lavras, 2010.
PONNIAH, P. Data Warehousing Fundamentals: A Comprehensive Guide for IT
Professionals. John Wiley and Sons, Inc, 2001.
MORETTI, Felipe Azevedo; OLIVEIRA, Vanessa Elias de; SILVA, Edina Mariko
Koga da. Acesso a informações de saúde na internet: uma questão de saúde pública?.
Revista da Associação Médica Brasileira, São Paulo, v. 58, n. 6, p.650-658, nov.2012. Elsevier BV. http://dx.doi.org/10.1590/s0104-42302012000600008.
VELOSO, Flávio Henrique da Silva et al. DATA MINING, SEUS BENEFÍCIOS,
UTILIZAÇÕES, METODOLOGIA, CAMPO DE ATUAÇÃO DENTRO DE
GRANDES E PEQUENAS EMPRESAS. Revista Eletrônica de Sistemas de
Informação e Gestão Tecnológica, Franca, v. 1, n. 1, p.45-53, 2011.
VIANNA, Rossana Cristina Xavier Ferreira et al. Mineração de dados e características
da mortalidade infantil. Cad. Saúde Pública [online]. 2010, vol.26, n.3, pp.535-542.
ISSN 0102-311X. http://dx.doi.org/10.1590/S0102-311X2010000300011.