Baixe o app para aproveitar ainda mais
Prévia do material em texto
O Uso da Mineração de Dados na Área de Saúde Artur Pasetto 1, Thiago Borges Vieira2 Instituto Federal Catarinense ( IFC) Caixa Postal 89560-000 – Videira - SC - Brasil artur5pasetto@gmail.com,thyagoborges.v@gmail.com Abstract. We present this article the adversity of the great amount of information on the internet, causing people to not find data. This mode, we bring data mining as a solution to these complications, highlighting examples of how it was used. Resumo. Apresentamos neste artigo a adversidade da grande quantidade de informações na internet, fazendo com que muitas vezes não encontramos dados adequados. Deste modo, trazemos a mineração de dados como uma possível solução para essas complicações, destacando exemplos de como ela foi utilizada. 1. Introdução A enorme quantidade crescente de dados, coletados e armazenados em grandes e numerosos repositórios de dados, excedeu em muito nossa capacidade humana de abstração sem técnicas. Com base nessa afirmação, podemos concluir que, existem obstáculos ao tentar encontrar dados congruentes. (HAN; KAMBER; PEI, 2012) Consequentemente, o uso de mineração de dados resulta como uma elucidação para essa adversidade. Aliás, Galvão e Marin (2009) apontam que “isso provavelmente acontece em decorrência de um ritmo alucinante de geração de dados, o que produz uma incapacidade natural no ser humano de explorar, extrair e interpretar estes dados para obter conhecimento dessas bases”. Para manipular esse grande volume de dados, utiliza-se uma prática conhecida como mineração de dados, que é caracterizado como um processo que encontra um pequeno conjunto relacionado pertinente à algo de um grande volume de dados (HAN;KAMBER;PEI, 2012). 2. Desenvolvimento 2.1 Mineração de dados Tomamos como exemplo, que várias pessoas buscaram algumas peças de computador em uma loja online. Por coincidência, várias pessoas que compraram processadores caros, acabaram comprando placa-mães com preço menor. Para entendermos o vínculo entre os produtos, Han, Kamber e Pei (2012, p.403) apontam que “mineração de dados descobre relacionamentos desse tipo. Os relacionamentos podem estar entre dois ou mais objetos diferentes junto com a dimensão de tempo”. A mineração de dados utiliza-se de técnicas para tal, não apenas como classificação, clustering bem como direcionada e não direcionada. A mineração direcionada categoriza algum alvo específico enquanto a mineração de dados não direcionada encontra semelhanças entre grupos sem predefinições (BERRY; LINOFF, 2014). Um dos exemplos de mineração direcionada é a classificação e de mineração não direcionada é o clustering. A seguir serão apresentados alguns métodos utilizados pela mineração de dados. 2.1.1 Classificação A Classificação, como o nome já indica, é classificar dados. Portanto, esse processo analisa os dados que já contém uma classificação para “aprender” a classificar novos registros (GALVÃO; MARIN, 2001). Em suma, a tarefa é construir um modelo de algum tipo que pode ser aplicado a dados não classificados, a fim de classificá-lo (BERRY; LINOFF, 2014). A classificação pode ser utilizada para diagnosticar doenças, indicar um aluno para uma turma, uma fraude de transação de um cartão e outros fins (CAMILO; SILVA, 2009). Sob o mesmo ponto de vista de sua utilização, Camilo e Silva (2009, p. 12) apontam: “um laboratório pode usar sua base histórica de voluntários e verificar em quais indivíduos uma nova droga pode ser melhor administrada”. 2.1.2 Clustering Uma das técnicas de mineração de dados é clustering ou agrupamento, um processo que visa agrupar os dados em categorias por suas similaridades entre eles, ou seja, quantos mais os dados ficam semelhantes em relação à outro, são designados em um grupo. Consequentemente, os grupos tornam-se homogêneos em seu universo, porém, heterogêneos entre si (CORTÊS; PORCARO; LIFSCHITZ, 2002). Em virtude disso, mercados melhoram seus ganhos reorganizando as prateleiras com base na descoberta (PONNIAH, 2001). Além do mais, Camilo e Silva (2009, p. 10) ressaltam: “As aplicações das tarefas de agrupamento são as mais variadas possíveis: pesquisa de mercado, reconhecimento de padrões, processamento de imagens, análise de dados, segmentação de mercado, taxonomia de plantas e animais, pesquisas geográficas, classificação de documentos da Web, detecção de comportamentos atípicos (fraudes), entre outras”. 2.1.3 Associação A regra de associação “consiste em identificar quais atributos estão relacionados. Apresentam a forma: SE atributo X ENTÃO atributo Y” (CAMILO; SILVA, 2009, p. 10). Normalmente as regras de associação são aplicadas quando se quer explorar afinidades ou preferências. Por exemplo, quando dois produtos que são comprados juntos, podem ser criados “pacotes” para os clientes, que contenham estes dois produtos (CORTÊS; PORCARO; LIFSCHITZ, 2002). 2.2 A Área de Saúde Sob o mesmo ponto de vista dito anteriormente, a quantidade de informações sobre saúde pode acabar em um diagnóstico errado, aliás, “[...] 85% da amostra disseram utilizar mecanismos de busca como Yahoo, Cadê e Google para pesquisar questões relacionadas com saúde e medicamentos [...]” segundo Moretti, Oliveira e Silva (2012). Assim sendo, a mineração de dados destaca-se no setor da saúde por suas aplicabilidades em “análise da eficácia de certos tratamentos, a otimização de processos dentro de um hospital, o relacionamento de dados sobre o estado de saúde do paciente com a qualificação médica; e a análise de efeitos colaterais de drogas” que CORTÊS, PORCARO, LIFSCHITZ (2002, p. 33) destacam. Além disso, salientam que “diversos aparelhos de diagnósticos estão sendo desenvolvidos segundo os padrões encontrados em populações observadas ao longo de vários anos. Seu objetivo é detectar e identificar, principalmente, grupo de riscos para os pacientes e trabalhar na prevenção de possíveis doenças” (CORTÊS; PORCARO; LIFSCHITZ, 2002, p. 33). 2.2.1 Hipertensão A KMIC (The Korea Medical Insurance Corporation) utilizou-se da mineração de dados na área de saúde, fazendo exames de hipertensão em todos os funcionários do serviço civil, professores e seus dependente. Dados como pressão arterial, colesterol, altura e peso, foram coletados durante o exame físico (CHAE et al., 2001). Segundo CHAE et al (2001), “[...] a regra de associação foi usada para identificar a relação de ocorrência entre a hipertensão e vários fatores de risco modificáveis, como fumar ou beber”. Abaixo são mostrados exemplos de como a regra de associação foi utilizada no programa de controle de hipertensão da KMIC (CHAE et al, 2001): Se o exercício = não e (43 < idade < 48) e sexo = feminino, então a probabilidade de hipertensão é de 21%. Se o exercício = não e fumar = sim e beber = sim, então a probabilidade de hipertensãoé de 26%. Em resumo, “[...] a regra de associação mostrou que a existência de todos os três fatores de risco modificáveis (fumo, bebida e exercício) aumentou significativamente a probabilidade de hipertensão, independentemente do sexo” (CHAE et al, 2001). 2.2.2 Mortalidade Infantil Em uma pesquisa realizada pelo Comitê Estadual de Prevenção da Mortalidade Infantil ocorreram 9372 óbitos infantis, que destes, foram analisados 7256 (VIANNA et al., 2010). Devido a isso, VIANNA et al. Realizaram um estudo a fim de identificar alguns padrões na predição da mortalidade infantil através do uso do Data Mining. Desse modo, foi elaborada uma uma base de dados com diversos óbitos infantis que foram analisados por Comitês de prevenção da Mortalidade Infantil entre 2000 e 2004. Assim, foi usado a mineração para fazer uma busca no banco de dados que gerasse regras que eram analisadas e transformadas em informação útil. Após a mineração, foram selecionadas 4.230 regras. Desta forma, um exemplo de regra pode ser conferido logo abaixo: Se mãe adolescente e peso ao nascer < 2.500g, ou parto pós-termo e mãe adolescente com outro filho, ou com afecções maternas. Então o risco para óbito neonatal é maior. Com isso, foi vista a necessidade de estabelecer maior atenção às adolescentes, às crianças com peso ao nascer < 2.500g, pós-termo e filhas de mães com afecções maternas (VIANNA et al., 2010). 2.3 Outras Áreas 2.3.1 Web Mining “O web mining agrupa, em três diferentes abordagens [...]. Essas abordagens são a mineração de conteúdo (web content mining), a mineração de estrutura (web structure mining ) e a mineração de uso (web usage mining) [...]” (KIPPES, 2010, p. 26). A mineração de estrutura da web é voltada para a análise de domínios de sites na internet, visando explorar as conexões de um site na internet. Por outro lado, a mineração de uso é voltada para a reação dos usuários navegando em um site, realizando um registro. Nesse sentido, esses registros podem ajudar na estrutura do site (KIPPES, 2010). Conforme dito anteriormente, a mineração de dados é lidar com uma grande massa de dados, sejam elas comerciais, educacionais, informações de clientes, etc; portanto, ao tratarmos de dados na Web dizemos que “[...] é a aplicação de técnicas de mineração de dados para descobrir padrões, estruturas e conhecimento da Web.” (HAN; KAMBER; PEI, 2001, p.597). Associando o uso de web mining com o exemplo da compra de processadores e placa-mães, este pode por fim, promover a compra de produtos de diversos grupos no mesmo tempo, além de melhorar a eficiência e qualidade dos serviços (HAN; KAMBER; PEI, 2012). Além do exemplo anterior, podemos adentrar na área financeira com detecção de fraudes, previsão de preços de commodities até mesmo previsão de desastre financeiro (PONNIAH, 2001). Um dos exemplos que ressaltamos do uso de mineração de dados na área financeira foi quando o Bank of America usou técnicas para prever clientes com menos riscos de calote, concedendo-lhes linhas de créditos, lucrando 30 milhões de dólares (VELOSO et al., 2011). 2.3.1 Informações na Internet A internet colaborou com a divulgação e busca de informações de diversas fontes, entretanto, com o grande crescimento de informações Moretti, Oliveira e Silva (2012) apontam que “[...] se por um lado existe a facilidade de encontrar todo tipo de informação na internet, por outro há dificuldade de se atingir informações seguras, visto que a quantidade de dados dificulta a localização de uma fonte confiável”. 2.3.2 E-commerce A mineração de dados não só está inserida na área de saúde, como também em sistemas de recomendações na internet. Por exemplo, em sites de e-commerce com suas recomendações para os usuários, que são baseadas nas compras anteriores ou nas navegações entre os produtos (BÜCHNER; MULVENNA, 1998). Da mesma forma que a mineração de dados descobre padrões para recomendações, um de seus outros usos é a atração ou seleção de novos clientes. Uma das técnicas é usar como parâmetros outros usuários que já visitaram o site para criar regras de marketing e aplicar aos novos visitantes. Dessa forma, a regra pode ser utilizada para a criação de ofertas especiais dependendo do tempo que o usuário passou em sites de compras (BÜCHNER; MULVENNA, 1998). 3. Conclusão Em virtude dos fatos mencionados, podemos afirmar que a mineração de dados nos ajuda em vários aspectos, tanto quanto na área e-commerce e saúde. Por meio da mineração e seu método de associação, a KMIC obteve resultados de como fumar, beber e não fazer exercício físico aumentam a probabilidade de hipertensão. Além do mais, o Comitê Estadual de Prevenção da Mortalidade Infantil também obteve resultados para predição de mortalidade infantil. Referências BERRY, Michael J.A.; LINOFF, Gordon S. Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management. 2. ed. Indianapolis: Wiley Publishing, Inc, 2014. BÜCHNER, Alex G.; MULVENNA, Maurice D.. Discovering Internet marketing intelligence through online analytical web usage mining. Acm Sigmod Record, New York, v. 27, n. 4, p.54-61, dez. 1998. Association for Computing Machinery (ACM). http://dx.doi.org/10.1145/306101.306124. CAMILO, Cássio Oliveira; SILVA, João Carlos da. Mineração de dados: Conceitos, Tarefas, Métodos e Ferramentas . 2009. 28 f. Dissertação (Mestrado) - Curso de Ciência da Computação, Universidade Federal de Goiás, Goiás, 2009. CHAE, Young Moon et al. Data mining approach to policy analysis in a health insurance domain. International Journal Of Medical Informatics , v. 62, n. 2-3, p.103-111, jul. 2001. Elsevier BV. http://dx.doi.org/10.1016/s1386-5056(01)00154-x. CORTÊS, Sérgio da Costa; PORCARO, Rosa Maria; LIFSCHITZ, Sérgio. Mineração de dados - Funcionalidades, Técnicas e Abordagens. Rio de Janeiro: Puc-rio, 2002. GALVAO, Noemi Dreyer and MARIN, Heimar de Fátima. Técnica de mineração de dados: uma revisão da literatura . Acta paul. enferm. [online]. 2009, vol.22, n.5, pp.686-690. ISSN 0103-2100. http://dx.doi.org/10.1590/S0103-21002009000500014. HAN, Jiawey; KAMBER, Micheline; PEI, Jian. Data Mining : Concepts and Techniques. 3. ed. Waltham: Elsevier Inc, 2012. 740 p. KIPPES, Alexander. Mineração de dados e análise do comportamento do consumidor: Estudo de caso em um website de ensino a distância. 2010. 116 f. Dissertação (Mestrado) - Curso de Administração, Universidade Federal de Lavras, Lavras, 2010. PONNIAH, P. Data Warehousing Fundamentals: A Comprehensive Guide for IT Professionals. John Wiley and Sons, Inc, 2001. MORETTI, Felipe Azevedo; OLIVEIRA, Vanessa Elias de; SILVA, Edina Mariko Koga da. Acesso a informações de saúde na internet: uma questão de saúde pública?. Revista da Associação Médica Brasileira, São Paulo, v. 58, n. 6, p.650-658, nov.2012. Elsevier BV. http://dx.doi.org/10.1590/s0104-42302012000600008. VELOSO, Flávio Henrique da Silva et al. DATA MINING, SEUS BENEFÍCIOS, UTILIZAÇÕES, METODOLOGIA, CAMPO DE ATUAÇÃO DENTRO DE GRANDES E PEQUENAS EMPRESAS. Revista Eletrônica de Sistemas de Informação e Gestão Tecnológica, Franca, v. 1, n. 1, p.45-53, 2011. VIANNA, Rossana Cristina Xavier Ferreira et al. Mineração de dados e características da mortalidade infantil. Cad. Saúde Pública [online]. 2010, vol.26, n.3, pp.535-542. ISSN 0102-311X. http://dx.doi.org/10.1590/S0102-311X2010000300011.
Compartilhar