Buscar

CP PPGI M Da Silva, João Vitor 2016

Prévia do material em texto

UNIVERSIDADE TECNOLO´GICA FEDERAL DO PARANA´
CAˆMPUS CORNE´LIO PROCO´PIO
DIRETORIA DE PESQUISA E PO´S-GRADUAC¸A˜O
PROGRAMA DE PO´S-GRADUAC¸A˜O EM INFORMA´TICA
JOA˜O VITOR FERRARI DA SILVA
FA´CIL BULA: SISTEMA QUE ESTRUTURA O BULA´RIO
ELETROˆNICO DA ANVISA
DISSERTAC¸A˜O DE MESTRADO
CORNE´LIO PROCO´PIO
2016
JOA˜O VITOR FERRARI DA SILVA
FA´CIL BULA: SISTEMA QUE ESTRUTURA O BULA´RIO
ELETROˆNICO DA ANVISA
Dissertac¸a˜o de Mestrado apresentada ao Programa
de Po´s-Graduac¸a˜o em Informa´tica da Universidade
Tecnolo´gica Federal do Parana´ - UTFPR como requi-
sito parcial para a obtenc¸a˜o do tı´tulo de “Mestre em
Informa´tica”.
Orientador: Prof. Dr. Andre´ Yoshiaki Kashiwabara
Coorientador: Prof. Dr. Carlos Nascimento Silla Junior
CORNE´LIO PROCO´PIO
2016
Dados Internacionais de Catalogação na Publicação 
 
S586 Silva, João Vitor Ferrari da 
 Fácil bula : sistema que estrutura o bulário eletrônico da ANVISA / João Vitor Ferrari da Silva 
. – 2016. 
 139 f. : il. ; 30 cm 
 
Orientador: André Yoshiaki Kashiwabara. 
Coorientador: Carlos Nascimento Silla Junior 
Dissertação (Mestrado) – Universidade Tecnológica Federal do Paraná. Programa de Pós- 
graduação em Informática. Cornélio Procópio, 2016. 
Referências: p.115 -121. 
 
1. Mineração de dados (Computação). 2. Medicamentos - Interações. 3. Farmacologia. 4. 
Informática - Dissertações. I. Kashiwabara, André Yoshiaki, orient. II. Silla Junior, Carlos 
Nascimento, coorient. III. Universidade Tecnológica Federal do Paraná. Programa de Pós-
Graduação em Informática. IV. Título. 
 
 CDD (22. ed.) 004 
Biblioteca da UTFPR, Câmpus Cornélio Procópio 
 
 
Ministério da Educação 
Universidade Tecnológica Federal do Paraná 
Câmpus Cornélio Procópio 
Programa de Pós-Graduação em Informática 
 
 
Av. Alberto Carazzai, 1640 - 86.300-000- Cornélio Procópio – PR. 
Tel. +55 (43) 3520-4055 / e-mail: ppgi-cp@utfpr.edu.br / www.utfpr.edu.br/cornelioprocopio/ppgi 
Título da Dissertação Nº 19: 
 
“FÁCIL BULA: SISTEMA QUE ESTRUTURA O BULÁRIO 
ELETRÔNICO DA ANVISA”. 
por 
 
João Vitor Ferrari da Silva 
 
Orientador: Prof. Dr. André Yoshiaki Kashiwabara 
 
 
Esta dissertação foi apresentada como requisito parcial à obtenção do 
grau de MESTRE EM INFORMÁTICA – Área de Concentração: Computação 
Aplicada, pelo Programa de Pós-Graduação em Informática – PPGI – da 
Universidade Tecnológica Federal do Paraná – UTFPR – Câmpus Cornélio 
Procópio, às 10h do dia 25 de maio de 2016. O trabalho foi _____________ pela 
Banca Examinadora, composta pelos professores: 
 
 
 
__________________________________ 
Prof. Dr. André Yoshiaki Kashiwabara 
(Presidente – UTFPR-CP) 
 
 
 
__________________________________ 
Prof. Dr. Carlos Nascimento Silla Junior 
(Coorientador – UTFPR-CP) 
 
 
 
__________________________________ 
Prof. Dr. Alessandro Botelho Bovo 
(UTFPR-LD) 
 
 
 
__________________________________ 
Profa. Dra. Gabrielle Jacklin Eler 
(IFPR-LD) 
 
 
 
 
Visto da coordenação: 
 
 
 
 
 
__________________________________ 
André Takeshi Endo 
Coordenador do Programa de Pós-Graduação em Informática 
UTFPR Câmpus Cornélio Procópio 
A Folha de Aprovação assinada encontra-se na Coordenação do Programa. 
 
AGRADECIMENTOS
Agradec¸o a` Deus e a MTA, por sempre me abenc¸oarem com sau´de, forc¸a e protec¸a˜o.
Agradec¸o a` toda minha famı´lia, em especial aos meus pais, Joa˜o e Marli, por me
educarem e serem exemplos de dedicac¸a˜o e honestidade. Agradec¸o a` minha namorada Tatiane
por ter me apoiado e compreendido minha auseˆncia para elaborac¸a˜o deste trabalho.
Ao professor orientador Andre´ Kashiwabara pelos conselhos, por toda ajuda desempe-
nhada, pela motivac¸a˜o e auxı´lio na organizac¸a˜o do trabalho, ao professor coorientador Carlos
Silla com dicas valiosas de pesquisa e conhecimento em alternativas para elaborac¸a˜o dos desa-
fios do trabalho, e a todos os outros professores que contribuı´ram para elaborac¸a˜o do presente
trabalho e aos outros colaboradores da UTFPR.
Agradec¸o aos meus amigos, em especial ao grupo COMBO, por serem companhia
constante em minha vida, juntamente com meus colegas de trabalho, principalmente ao Bruno,
Gabriel, Felipe, Higor, Thiago, Raul, Eduardo, Cristiano e Gustavo que contribuı´ram para o
desenvolvimento deste trabalho.
RESUMO
DA SILVA, Joa˜o Vitor Ferrari. FA´CIL BULA: SISTEMA QUE ESTRUTURA O BULA´RIO
ELETROˆNICO DA ANVISA. 137 f. Dissertac¸a˜o de Mestrado – Programa de Po´s-Graduac¸a˜o
em Informa´tica, Universidade Tecnolo´gica Federal do Parana´. Corne´lio Proco´pio, 2016.
O trabalho desempenhado pelos profissionais da a´rea de sau´de quando voltado ao cuidado das
pessoas consiste, por vezes, na escolha dos melhores medicamentos para o sucesso terapeˆutico
no tratamento de pacientes. Existem va´rios medicamentos disponı´veis no mercado brasileiro,
assim para que o profissional encontre as informac¸o˜es sobre o medicamento que pode ser melhor
indicado para o paciente ha´ aplicativos e ferramentas que facilitam a pesquisa dos medicamentos
e auxiliam o trabalho deste especialista. Contudo em nossa busca na˜o foram encontrados siste-
mas que possuem a identificac¸a˜o de reac¸o˜es adversas, contraindicac¸o˜es, interac¸o˜es medicamen-
tosas, adverteˆncias e precauc¸o˜es entre a associac¸a˜o conjunta de medicamentos regulamentados
pela Ageˆncia Nacional de Vigilaˆncia Sanita´ria (ANVISA). Nesse contexto, o Bula´rio Eletroˆnico
da ANVISA disponibiliza um conjunto de 6.961 bulas profissionais em formato PDF, contudo
as informac¸o˜es nelas contidas na˜o esta˜o estruturadas. Um dos desafios deste trabalho consistiu
em extrair automaticamente as informac¸o˜es presentes nesse conjunto de bulas. Este trabalho
apresenta uma metodologia semiautoma´tica de minerac¸a˜o de textos para mapear as bulas da
ANVISA nas redes de interac¸o˜es entre fa´rmacos da base de dados DrugBank, juntamente com
as doenc¸as encontradas na base SNOMED-CT. Os medicamentos, as doenc¸as, os fa´rmacos e
suas relac¸o˜es foram estruturadas e armazenadas em um banco de dados em grafos utilizando a
tecnologia Neo4j. Por meio dos resultados obtidos foi desenvolvido o Fa´cil Bula, website com
objetivo de desenvolver ferramentas que facilitem a pesquisa de medicamentos e doenc¸as para
profissionais da a´rea de sau´de. Desse modo, teve seu projeto aceito no processo de incubac¸a˜o
do Hotel Tecnolo´gico da Incubadora de Inovac¸o˜es da Universidade Tecnolo´gica (IUT). O portal
web do Fa´cil Bula contabilizou acessos por todo territo´rio brasileiro, principalmente em gran-
des capitais como Sa˜o Paulo e Rio de Janeiro, ale´m de conquistar um bom posicionamento nas
pesquisas orgaˆnicas do Google relacionadas a algumas palavras-chave de medicamentos e da
Classificac¸a˜o Internacional de Doenc¸as (CID).
Palavras-chave: minerac¸a˜o de textos, bulas, interac¸o˜es, fa´rmaco, doenc¸a
ABSTRACT
DA SILVA, Joa˜o Vitor Ferrari. FA´CIL BULA: SYSTEM THAT STRUCTURE TO THE AN-
VISA’S “BULA´RIO ELETROˆNICO”. 137 f. Dissertac¸a˜o de Mestrado – Programa de Po´s-
Graduac¸a˜o em Informa´tica, Universidade Tecnolo´gica Federal do Parana´. Corne´lio Proco´pio,
2016.
The work done by health area professionals when facing the care of people consists on choo-
sing the best medications for the success of the treatment of them. There are many medications
available on the brazilian market, so for this professional find the information about the medi-
cation which could be the best match for the pacient there is which applications and tools make
easier the search of drugs and helps this specialist.However, none of these systems had drug
adverse reaction identification, contraindications, medical interactions, warnings and precauti-
ons between the overall association of drugs regulated by the “Ageˆncia Nacional de Vigilaˆncia
Sanita´ria” (ANVISA). In this context, the ANVISA’s “Bula´rio Eletroˆnico” offers a collection
of 6,961 professional medication guides in PDF file format. However, the information availa-
ble in these guides are in an unstructured format. One of challenges of this work consisted in
the automatic retrieval of information from ANVISA’s medication guides. This paper presents a
semiautomatic procedure that maps ANVISA’s medication guides to DrugBank and SNOMED-
CT. The medications, the diseases, the drugs, and their relations were structured and stored on
a graph database using the Neo4j technology. Fa´cil Bula, was developed through results of
studies, it is a website which goals to conceive tools to facilitate the medication and disease
search for health professionals, it hits all the brazilian territory, mainly big capitals like Sa˜o
Paulo and Rio de Janeiro, as well as gain a good position in organic Google searches related to
some keywords medicines and International Classification of Diseases (ICD).
Keywords: text mining, drug information, interactions, drug, disease
LISTA DE FIGURAS
–FIGURA 1 Termo demeˆncia de Alzheimer encontrado no to´pico de indicac¸o˜es do
medicamento Eranz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
–FIGURA 2 To´pico de contraindicac¸o˜es do medicamento Kolantyl, que e´ contraindi-
cado para pacientes em tratamento da doenc¸a de Alzheimer. . . . . . . . . . . . . . 32
–FIGURA 3 To´pico indicac¸a˜o do medicamento Furp-Estreptomicina destinado ao tra-
tamento de tuberculose e o to´pico adverteˆncias e precauc¸o˜es do medica-
mento Mud Oral que informa o cuidado para pacientes com tuberculose. . . 33
–FIGURA 4 A carbamazepina interage com o cloridrato de ioimbina, princı´pio ativo
do Yomax. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
–FIGURA 5 O fa´rmaco fenobarbital encontrado na composic¸a˜o do medicamento Gar-
denal tem reac¸a˜o adversa com o medicamento Dacarbazina. . . . . . . . . . . . . . 35
–FIGURA 6 Alguns to´picos encontrados na bula do medicamento Cataflam. . . . . . . . . 37
–FIGURA 7 Variac¸o˜es de tı´tulos encontrados para o to´pico superdose dos medica-
mentos Betnovate, Brilinta e Ozonyl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
–FIGURA 8 Erro ortogra´fico encontrado no medicamento Setronax. . . . . . . . . . . . . . . . 38
–FIGURA 9 To´pico do medicamento Ebastel escrito no plural, mas para o medica-
mento Norfloxacino foi encontrado no singular. . . . . . . . . . . . . . . . . . . . . . . . . 39
–FIGURA 10 To´pico do medicamento Finagripe escrito conforme o novo acordo or-
togra´fico da Lı´ngua Portuguesa, diferente do to´pico encontrado no medica-
mento Gretivit que esta´ escrito segundo o antigo acordo. . . . . . . . . . . . . . . . . 39
–FIGURA 11 Imagem da bula fı´sica do medicamento Manitol adicionado ao arquivo
PDF e na˜o digitalizado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
–FIGURA 12 Termos relacionados a fa´rmacos encontrados no to´pico composic¸a˜o da
bula do medicamento Cataflam. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
–FIGURA 13 Termo doenc¸a cardı´aca encontrado no medicamento Afrin que representa
um conjunto de doenc¸as relacionadas, diferente do medicamento Cefaliv
que apresenta o termo infarto do mioca´rdio relacionado a uma doenc¸a mais
especı´fica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
–FIGURA 14 Sentence breaker aplicado ao to´pico “cuidados de armazenamento” do
medicamento Amoxicilina. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
–FIGURA 15 Exemplo de tags utilizadas pelo Part-Of-Speech Tags usado por Hepple
Tagger em lı´ngua inglesa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
–FIGURA 16 Exemplo da te´cnica Stemming para obtenc¸a˜o do radical das palavras. . . 52
–FIGURA 17 Exemplo de verificac¸a˜o de similaridade entre “JONES” e “JOHNSON”. 52
–FIGURA 18 Integrac¸a˜o ilustrada por flechas direcionais das bases de dados e o Bula´rio
Eletroˆnico da ANVISA que na˜o normaliza informac¸a˜o alguma com as ba-
ses relacionadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
–FIGURA 19 Representac¸a˜o gra´fica da relac¸a˜o “e´ um” do SNOMED-CT. . . . . . . . . . . . 61
–FIGURA 20 Organizac¸a˜o da CID para demeˆncia na doenc¸a de Alzheimer de inı´cio
precoce. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
–FIGURA 21 Visa˜o geral do workflow de processamento das bulas profissionais com
as respectivas etapas que compo˜em o processo desenvolvido. . . . . . . . . . . . . 65
–FIGURA 22 Pa´gina inicial do Bula´rio Eletroˆnico da ANVISA e os respectivos filtros
dessa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
–FIGURA 23 Pa´gina de resultado da pesquisa do Bula´rio Eletroˆnico. . . . . . . . . . . . . . . . 67
–FIGURA 24 Conteu´do da bula em imagem que esta´ fora do padra˜o. . . . . . . . . . . . . . . . 68
–FIGURA 25 Etapas do processamento textual para identificac¸a˜o dos to´picos no medi-
camento Fluconazol. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
–FIGURA 26 Marcac¸a˜o dos respectivos to´picos no texto da bula do medicamento Flu-
conazol. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
–FIGURA 27 Exemplo de integrac¸a˜o das bases ao conteu´do das bulas. . . . . . . . . . . . . . . 77
–FIGURA 28 Termos relativos a`s doenc¸as Influenza A e Influenza B, como tambe´m ao
fa´rmaco Oseltamivir presente na bula profissional do medicamento Tamiflu. 77
–FIGURA 29 Exemplo ilustrativo do resultado da identificac¸a˜o dos fa´rmacos no medi-
camento Lotanol. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
–FIGURA 30 Estrutura do grafo apresentando as relac¸o˜es entre medicamento gerada
pela ferramenta de consulta do Neo4j. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
–FIGURA 31 Exemplo do banco de dados em grafos gerada pela ferramenta de con-
sulta Neo4j. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
–FIGURA 32 Detalhes do medicamento Atrovex disponibilizado pelo website Fa´cil
Bula. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
–FIGURA 33 Medicamentos indicados para tratamento de Alzheimer. . . . . . . . . . . . . . . 96
–FIGURA 34 Relac¸a˜o entre os termos de doenc¸as. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
–FIGURA 35 Medicamentos que possuem aspirina em sua composic¸a˜o. . . . . . . . . . . . . . 97
–FIGURA 36 Medicamentos que possuem aspirina em sua composic¸a˜o, pore´m sa˜o
contraindicados para insuficieˆncia renal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
–FIGURA 37 Website do Fa´cil Bula. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
–FIGURA 38 Resultado da ferramenta Structured Data Testing Tool em uma pa´gina de
CID do Fa´cil Bula. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . 100
–FIGURA 39 Pa´gina do aplicativo Fa´cil Bula na App Store. . . . . . . . . . . . . . . . . . . . . . . . 102
–FIGURA 40 Quantidade de downloads do aplicativo Fa´cil Bula na App Store. . . . . . . 102
–FIGURA 41 Estatı´sticas do Fa´cil Bula no perı´odo de junho a julho. . . . . . . . . . . . . . . . . 103
–FIGURA 42 Visa˜o geral de aquisic¸a˜o no perı´odo de junho a julho. . . . . . . . . . . . . . . . . . 104
–FIGURA 43 Cobertura geogra´fica de acessos por estados do Brasil entre o perı´odo
junho a julho. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
–FIGURA 44 Cobertura geogra´fica de acessos por cidades brasileiras entre o perı´odo
junho a julho. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
–FIGURA 45 Palavras-chave de medicamentos realizadas na pesquisa do Google entre
o perı´odo junho a julho. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
–FIGURA 46 Anu´ncio criado para o website Fa´cil Bula. . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
–FIGURA 47 Histo´rico de transac¸o˜es do AdWords no meˆs de agosto. . . . . . . . . . . . . . . . 108
–FIGURA 48 Histo´rico de transac¸o˜es do AdWords no meˆs de setembro. . . . . . . . . . . . . 108
–FIGURA 49 Estatı´sticas do Fa´cil Bula no perı´odo de junho a setembro. . . . . . . . . . . . . 109
–FIGURA 50 Palavras-chave com melhor desempenho. . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
–FIGURA 51 Mapa com a localizac¸a˜o de acessos realizados no website Fa´cil Bula. . . 110
LISTA DE TABELAS
–TABELA 1 Comparac¸a˜o das ferramentas relacionadas pesquisadas. . . . . . . . . . . . . . . 46
–TABELA 2 Listagem de banco de dados estudados para o projeto. . . . . . . . . . . . . . . . . 56
–TABELA 3 Lista de variac¸o˜es e marcadores utilizados para identificac¸a˜o dos to´picos. 72
–TABELA 4 Listagem das bases integradas em Lı´ngua Inglesa. . . . . . . . . . . . . . . . . . . . 78
–TABELA 5 Listagem das bases integradas em Lı´ngua Portuguesa. . . . . . . . . . . . . . . . . 78
–TABELA 6 Padro˜es para identificar fa´rmacos nas bulas. . . . . . . . . . . . . . . . . . . . . . . . . . 82
–TABELA 7 Exemplos de como pode ser utilizada a linguagem Cypher. . . . . . . . . . . . 88
–TABELA 8 Lista com a quantidade de relac¸o˜es identificadas com medicamentos en-
tre fa´rmacos e doenc¸as inferidas na base Neo4j. . . . . . . . . . . . . . . . . . . . . . . . . 94
LISTA DE SIGLAS
ANVISA Ageˆncia Nacional de Vigilaˆncia Sanita´ria
API Application Programming Interface
AWS Amazon Web Services
CID Classificac¸a˜o Internacional de Doenc¸as
COSTART Coding Symbols for a Thesaurus of Adverse Reaction Terms
CPC Cost-per-click
CT Clinical Terms
CTD Comparative Toxicogenomics Database
CTR Clickthrough rate
DATASUS Departamento de Informa´tica do Sistema U´nico de Sau´de
DDS Diseases Database Search
DNS Domain Name System
DO Disease Ontology
DSL Domain-Specific Languages
FDA Food and Drug Administration
HGNC HUGO Gene Nomenclature Committee
HUGO Human Genome Organisation
ICD International Classification of Diseases
IIS Internet Information Services
INPI Instituto Nacional da Propriedade Industrial
IUT Incubadora de Inovac¸o˜es da Universidade Tecnolo´gica
KEGG Kyoto Encyclopedia of Genes and Genomes
MedDRA Medical Dictionary for Regulatory Activities
MeSH Medical Subject Headings
MER Modelo Entidade Relacionamento
MS Ministe´rio da Sau´de
NoSQL Not Only Structured Query Language
NOTIVISA Sistema Nacional de Notificac¸o˜es para a Vigilaˆncia Sanita´ria
OCR Optical Character Recognition
OMIM Online Mendelian Inheritance in Man
OMS Organizac¸a˜o Mundial de Sau´de
PDF Portable Document Format
PLN Processamento de Linguagem Natural
REST Representational State Transfer
SBSI Simpo´sio Brasileiro de Sistemas de Informac¸a˜o
SEO Search Engine Optimization
SIDER Side Effect Resource
SNOMED Systematized Nomenclature of Medicine
SQL Structured Query Language
TTD Therapeutic Target Database
UMLS Unified Medical Language System
UniProt Universal Protein Resource
URL Uniform Resource Locator
USP United States Pharmacopeial
UTFPR Universidade Tecnolo´gica Federal do Parana´
SUMA´RIO
1 INTRODUC¸A˜O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.1 CONTEXTUALIZAC¸A˜O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.2 MOTIVAC¸A˜O E JUSTIFICATIVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.3 OBJETIVOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.3.1 Objetivo geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.3.2 Objetivos especı´ficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.4 ORGANIZAC¸A˜O DO TRABALHO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2 CARACTERIZAC¸A˜O DOS PROBLEMAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.1 BULAS ME´DICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.1.1 Contraindicac¸o˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.1.2 Adverteˆncias e precauc¸o˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.1.3 Interac¸o˜es medicamentosas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.1.4 Reac¸o˜es adversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.2 INTEGRAC¸A˜O ENTRE BASES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.2.1 Organizac¸a˜o do texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.2.2 Dificuldades com a fonte de informac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2.3 Irrelevaˆncia de termos Ontolo´gicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.2.4 Classificac¸a˜o entre os termos de doenc¸as . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3 REFERENCIAL TEO´RICO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.1 TRABALHOS RELACIONADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2 FARMACOVIGILAˆNCIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.3 AGEˆNCIA NACIONAL DE VIGILAˆNCIA SANITA´RIA (ANVISA) . . . . . . . . . . . . . 48
3.4 FOOD AND DRUG ADMINISTRATION (FDA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.5 TE´CNICAS DE MINERAC¸A˜O DE TEXTOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.6 BANCO DE DADOS EM GRAFOS: NEO4J . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.7 BANCO DE DADOS DA BIOMEDICINA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.7.1 DrugBank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.7.2 Comparative Toxicogenomics Database (CTD) . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 59
3.7.3 Systematized Nomenclature of Medicine - Clinical Terms (SNOMED-CT) . . . . . . . . 60
3.7.4 Disease Ontology (DO) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.7.5 Classificac¸a˜o Internacional de Doenc¸as (CID) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.7.6 ORPHANET . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.7.7 Side Effect Resource (SIDER) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4 MATERIAIS E ME´TODOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.1 VISA˜O GERAL DO WORKFLOW DE PROCESSAMENTO DAS BULAS PROFIS-
SIONAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.1.1 Aquisic¸a˜o das bulas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.1.2 Processamento das bulas profissionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.1.2.1 Roteiro para organizac¸a˜o dos to´picos da bula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.1.3 Integrac¸a˜o com outras bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.1.3.1 Roteiro para identificac¸a˜o dos fa´rmacos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.1.3.2 Roteiro para buscar os termos me´dicos referentes a`s doenc¸as . . . . . . . . . . . . . . . . . . . 82
4.1.4 Desenvolvimento do banco de dados baseado em grafo . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.2 INTEGRAC¸A˜O DO BULA´RIO ELETROˆNICO DA ANVISA COM AS BASES DRUG-
BANK E SNOMED-CT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.3 INFRAESTRUTURA UTILIZADA PARA O FA´CIL BULA . . . . . . . . . . . . . . . . . . . . . 90
5 RESULTADOS E DISCUSSA˜O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.1 CONJUNTO DE DADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.2 EXEMPLOS DE CONSULTAS AO BANCO EM GRAFOS . . . . . . . . . . . . . . . . . . . . . 95
5.3 IMPLEMENTAC¸A˜O FA´CIL BULA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.3.1 Application Programming Interface (API) e Nego´cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.4 ESTATI´STICAS DE ACESSO AO FA´CIL BULA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.5 HOTEL TECNOLO´GICO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
6 CONCLUSA˜O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.1 TRABALHOS FUTUROS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
REFEREˆNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
Anexo A -- ARTIGO SBSI 2015 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
Anexo B -- E-MAIL ANVISA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
Anexo C -- INSCRIC¸A˜O HOTEL TECNOLO´GICO - 1a ETAPA . . . . . . . . . . . . . . . . . . . 135
Anexo D -- CONVOCAC¸A˜O PARA BANCA - 2a ETAPA . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
Anexo E -- RESULTADO HOTEL TECNOLO´GICO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
21
1 INTRODUC¸A˜O
A Associac¸a˜o Brasileira de Redes de Farma´cias e Drogarias (ABRAFARMA) foi
criada pelas principais redes de farma´cias do paı´s para defender interesses e posic¸o˜es sobre
legislac¸o˜es referentes ao seu campo de atuac¸a˜o (ABRAFARMA, 2015). Segundo a ABRA-
FARMA, as suas redes associadas, que totalizam 4.941 lojas, foram responsa´veis em movi-
mentar cerca de R$ 28 bilho˜es no ano de 2013 em medicamentos, um crescimento de 13,48%
quando comparado ao total de vendas realizadas em 2012, este valor em vendas analisado com
a quantidade de cupons fiscais emitidos no ano inferem como se toda a populac¸a˜o brasileira ti-
vesse passado quatro vezes nas lojas da ABRAFARMA em 2013 (ABRAFARMA, 2015). Este
mercado conte´m inu´meros medicamentos permitidos pela Ageˆncia Nacional de Vigilaˆncia Sa-
nita´ria (ANVISA) que devem possuir bulas seguindo as normas da Resoluc¸a˜o-RDC No 47 (AN-
VISA, 2009), entre outras normas vigentes.
E´ importante que os profissionais da a´rea de sau´de tenham acesso a`s informac¸o˜es rela-
cionadas aos medicamentos disponı´veis comercialmente, para assim contribuir com efica´cia no
tratamento dos pacientes.
Contudo, obter informac¸o˜es sobre medicamentos e´ uma tarefa que requer um certo
trabalho devido a` dificuldade em acessar e relacionar estes dados divulgados pelas empresas
farmaceˆuticas responsa´veis, visto que, por vezes, as informac¸o˜es na˜o esta˜o centralizadas em
uma u´nica fonte de dados. Existem inu´meros instrumentos que auxiliam os profissionais nesta
tarefa, como livros, aplicativos e a pro´pria internet, na web destacam-se as ferramentas para
pesquisa de medicamentos que contribuem para o trabalho desempenhado pelos profissionais
da sau´de. Entretanto, muitas das ferramentas de pesquisas presentes na internet na˜o apresentam
dados detalhados sobre a relac¸a˜o de medicamentos com outros medicamentos, principalmente
informac¸o˜es em relac¸a˜o as contraindicac¸o˜es me´dicas, adverteˆncias e precauc¸o˜es quanto ao seu
uso, reac¸o˜es adversas e interac¸o˜es medicamentosas, ale´m de informac¸o˜es em relac¸a˜o a doenc¸as.
Dessa forma, um grande desafio consiste em organizar as informac¸o˜es relativas a`s bulas dos
medicamentos e relacionar estes dados com outras bulas.
As bulas me´dicas disponı´veis gratuitamente pela ANVISA, instituic¸a˜o vinculada ao
Ministe´rio da Sau´de (MS), destacam-se como fonte de informac¸a˜o sobre medicamentos. As
bulas aprovadas por esta ageˆncia seguem rigorosas normas a respeito das informac¸o˜es contidas
sobre os medicamentos e sa˜o disponibilizadas para download no formato Portable Document
Format (PDF). Pore´m, estes arquivos na˜o possuem dados estruturados, como a normalizac¸a˜o
de termos para doenc¸as e fa´rmacos (que sa˜o compostos quı´micos utilizados nos medicamentos)
22
relacionados entre os medicamentos, o que implica em uma dificuldade em realizar consultas e
associar as informac¸o˜es. A ANVISA na˜o disponibiliza ferramenta alguma que busque princı´pio
ativo (substaˆncia responsa´vel por exercer o efeito farmacolo´gico do medicamento) ou doenc¸as
e apresentem informac¸o˜es relacionadas a outros medicamentos. As informac¸o˜es disponı´veis
nas bulas sa˜o sobre apresentac¸a˜o do medicamento, indicac¸o˜es, contraindicac¸o˜es, adverteˆncias
e precauc¸o˜es em relac¸a˜o ao uso, interac¸o˜es medicamentosas. Por vezes, as ferramentas na˜o
encontram todo este conteu´do na bula de forma fa´cil, usual e clara para o profissional da a´rea
de sau´de.
Esta dissertac¸a˜o apresenta o Fa´cil Bula, projeto disponibilizado por meio de um web-
site e aplicativo mobile que implementa ferramentas que facilitam a busca de informac¸o˜es sobre
medicamentos.
O projeto implementou a estruturac¸a˜o do conteu´do das bulas da ANVISA, por meio da
minerac¸a˜o textual dos documentos em formato PDF e tambe´m da integrac¸a˜odos dados gerados
com outras fontes de informac¸o˜es, como bases de dados de fa´rmacos e doenc¸as. Estas bases
sa˜o aplicadas pela identificac¸a˜o de termos existentes entre fa´rmacos e doenc¸as encontrados no
conteu´do das bulas. Assim, foi possı´vel a criac¸a˜o de uma rede de medicamentos-fa´rmacos-
doenc¸as populada na base de dados em grafos. O banco de dados em grafo permite a consulta
de questionamentos frequentemente realizados pelos profissionais da sau´de durante a realizac¸a˜o
do trabalho de busca por medicamentos, pois possibilitou a apresentac¸a˜o de dados atualizados e
interligados entre a pesquisa de va´rios medicamentos, ou relac¸a˜o com doenc¸as e fa´rmacos. Este
trabalho gerou um workflow para o processamento do conteu´do das bulas. Para disponibilizar
os resultados obtidos pela estruturac¸a˜o e modelagem do banco de dados em grafos foi imple-
mentado um portal que e´ conhecido como Fa´cil Bula (www. f acilbula.com.br). O portal do
Fa´cil Bula e´ amplamente acessado e possui cerca de 5 mil acessos semanais contabilizados em
todos os estados brasileiros, mas principalmente por grandes capitais como Sa˜o Paulo e Rio de
Janeiro. A ideia desenvolvida pelo Fa´cil Bula foi aceita no processo de incubac¸a˜o do Hotel Tec-
nolo´gico da Incubadora de Inovac¸o˜es da Universidade Tecnolo´gica (IUT), em que foi avaliada
por membros de diversas instituic¸o˜es, como SEBRAE, FIEP, UTFPR e Prefeitura Municipal de
Corne´lio Proco´pio.
O Fa´cil Bula destaca uma pesquisa com recurso de autocomplete pelo nome do reme´dio,
a qual desconsidera acentuac¸a˜o, letras maiu´sculas e minu´sculas para encontrar os medicamen-
tos. O conteu´do das bulas publicadas no projeto e´ organizado em to´picos respectivos a cada
assunto especı´fico referente ao medicamento, como composic¸a˜o, contraindicac¸a˜o, indicac¸a˜o,
posologia, entre outros, desta forma, evita o acesso ao arquivo da bula em PDF da ANVISA para
consulta de informac¸o˜es. Desta estruturac¸a˜o de to´picos ha´ uma pesquisa de medicamentos por
23
meio de fa´rmacos ou de doenc¸as que associam informac¸o˜es encontradas em outros reme´dios,
fornecendo consultas como os fa´rmacos utilizados na composic¸a˜o, para quais doenc¸as sa˜o in-
dicadas o tratamento com este medicamento, contraindicac¸o˜es, reac¸o˜es adversas e interac¸o˜es
entre outros medicamentos.
1.1 CONTEXTUALIZAC¸A˜O
A ANVISA foi criada pela Lei no 9.782, no dia 26 de janeiro de 1999 (BRASIL,
1999). E´ uma autarquia federal vinculada ao MS, com campo de atuac¸a˜o em atividades de
regulamentac¸a˜o, normatizac¸a˜o, controle e fiscalizac¸a˜o na a´rea de vigilaˆncia sanita´ria. Nestas ati-
vidades compete a` ANVISA autorizar o funcionamento de empresas de fabricac¸a˜o, distribuic¸a˜o,
importac¸a˜o e comercializac¸a˜o de medicamentos.
Para os medicamentos regulamentados pela ANVISA serem comercializados ha´ a ne-
cessidade de que as empresas farmaceˆuticas elaborem um conjunto de informac¸o˜es sobre o
medicamento desenvolvido. As informac¸o˜es dizem respeito a` composic¸a˜o do medicamento,
indicac¸a˜o, adverteˆncias e precauc¸o˜es, contraindicac¸o˜es, interac¸o˜es medicamentosas e reac¸o˜es
adversas, e sa˜o redigidas em um texto com caracterı´sticas completas sobre o medicamento, este
texto e´ chamado de bula.
A bula e´ um dos instrumentos que detalham informac¸o˜es sobre os medicamentos para
os pacientes e profissionais, ou seja, uma bula possui duas verso˜es disponı´veis. Uma versa˜o
e´ para os pacientes conhecerem o medicamento por meio de uma linguagem mais simples,
voltada para o pu´blico em geral. A outra versa˜o e´ para os profissionais das a´reas de sau´de
conhecerem todas as especificac¸o˜es do medicamento com a finalidade de ver a efica´cia desse e
evitar situac¸o˜es que prejudiquem o tratamento dos pacientes. Assim, a bula torna-se uma impor-
tante fonte de informac¸a˜o para estes profissionais, pois sa˜o criadas pelas empresas responsa´veis
pelo medicamento e regulamentadas pela ANVISA (mais detalhes sobre o conteu´do das bulas
e´ encontrado no Capı´tulo 2).
O conhecimento das informac¸o˜es disponibilizadas pelas bulas profissionais e´ impor-
tante pois o sucesso terapeˆutico no tratamento de pacientes pode, por vezes, envolver diferentes
profissionais da a´rea de sau´de, em que cada profissional pode prescrever diversos medicamen-
tos. O uso de diversos medicamentos concomitantes pode ocasionar interac¸o˜es medicamento-
sas. Desse modo, os profissionais da sau´de precisam selecionar, de modo racional, medica-
mentos seguros a cada paciente, baseados em informac¸o˜es confia´veis. Em outras palavras, as
deciso˜es em relac¸a˜o ao tratamento medicamentoso, dada a prescric¸a˜o destes profissionais, sa˜o
determinantes para o sucesso de um tratamento (BRASIL, 2012).
24
E´ importante ressaltar que a inefica´cia ou falha terapeˆutica em certos tratamentos pode
ter relac¸a˜o com as reac¸o˜es adversas, visto que elas esta˜o entre as causas mais comuns de morte
nos paı´ses industrializados. Estima-se que aproximadamente 2 milho˜es de pacientes nos Esta-
dos Unidos sa˜o afetados a cada ano por reac¸o˜es adversas graves entre medicamentos, na qual
destes resultam 100.000 mortes por ano (LEAMAN et al., 2010).
No Brasil o tamanho real do problema referente aos erros de medicac¸a˜o e´ pouco conhe-
cido, pore´m dados estimados pela Fundac¸a˜o Oswaldo Cruz indicam que 24 mil mortes anuais
sa˜o ocasionadas por intoxicac¸a˜o medicamentosa (CASSIANI, 2005). Ha´ tambe´m um estudo
realizado em um hospital de Minas Gerais que apresenta estatı´sticas considera´veis em relac¸a˜o
ao tema, ou seja, afirma que em 3.177 (44,5%) dos 7.148 medicamentos de alto risco1, identifi-
cados em 4.026 prescric¸o˜es me´dicas, ocorreu algum tipo de erro relacionado ao medicamento.
Os erros esta˜o relacionados a` concentrac¸a˜o do reme´dio, a prescric¸a˜o pouco legı´vel, a taxa de
infusa˜o duvidosa, a omissa˜o de forma farmaceˆutica e da via de administrac¸a˜o dos medicamen-
tos (ROSA et al., 2009).
Neste contexto, para contribuir com a tomada de decisa˜o terapeˆutica dos profissionais
de sau´de, o MS em parceria com entidades privadas e demais o´rga˜os relacionados a` sau´de veˆm
promovendo e incentivando o uso racional de medicamentos. Trata-se de um documento te´cnico
que apresenta uma compilac¸a˜o das condutas baseadas em evideˆncias sobre medicamentos utili-
zados em atenc¸a˜o prima´ria a` sau´de, constantes no mo´dulo de informac¸o˜es do HO´RUS - Sistema
Nacional de Gesta˜o da Assisteˆncia Farmaceˆutica (BRASIL, 2012). Este documento aborda a
lo´gica da racionalidade na prescric¸a˜o, dispensac¸a˜o e administrac¸a˜o de medicamentos.
Ale´m desta cartilha elaborada pelo MS, existe um sistema desenvolvido pela ANVISA
que contempla uma colec¸a˜o de arquivos das bulas em PDF. Este sistema conta apenas com
uma opc¸a˜o simples de filtros para pesquisa de conteu´do especı´fico sobre o nome do medica-
mento, indu´stria farmaceˆutica, data de publicac¸a˜o, entre outros. O sistema de busca de bulas da
ANVISA na˜o possui uma opc¸a˜o de pesquisa diferenciada, como, por exemplo, verificar quais
medicamentos sa˜o indicados para tratamento de Alzheimer, ou quais os fa´rmacos utilizados na
composic¸a˜o de um determinado medicamento.
Um dos problemas com esse sistema e´ que a busca por informac¸o˜es em arquivos PDF
na˜o e´ usual para os profissionais conhecerem os medicamentos, pois ha´ a necessidade do down-
load e depois a leitura da bula em um visualizador de PDF.
Para organizar das informac¸o˜es nas bulas existem no cena´rio internacional bases de da-
1Medicamentos de alto risco: fa´rmacos com risco inerente de lesar o paciente quando existe falha no processo
de utilizac¸a˜o (ROSA et al., 2009).
25
dos que contemplam informac¸o˜es estruturadas referentesaos fa´rmacos, como e´ o caso do Drug-
Bank. A base DrugBank fornece informac¸o˜es sobre os fa´rmacos aprovados e na˜o aprovados
pelo Food and Drug Administration (FDA), e contempla um conjunto de interac¸o˜es fa´rmaco-
fa´rmaco suportada pela literatura biome´dica (WISHART et al., 2008). Tambe´m ha´ bases que
possuem vocabula´rios sobre doenc¸as, como o Systematized Nomenclature of Medicine - Clinical
Terms (SNOMED-CT). A base SNOMED-CT possui a classificac¸a˜o das doenc¸as organizadas
utilizando uma ontologia, ou seja, disponibiliza um vocabula´rio comum da a´rea biome´dica or-
ganizado em um grafo dirigido acı´clico (COˆTE´; PATHOLOGISTS; ASSOCIATION, 1993).
Contudo, o DrugBank na˜o permite a busca por fa´rmacos associados a doenc¸as uti-
lizando ontologias me´dicas, nem por meio da utilizac¸a˜o do CID (Co´digo Internacional de
Doenc¸as), enquanto que o SNOMED-CT na˜o apresenta os medicamentos que tratam cada uma
das doenc¸as.
1.2 MOTIVAC¸A˜O E JUSTIFICATIVA
As ferramentas nacionais para consulta de bulas dos medicamentos da˜o suporte ao
trabalho relacionado a` sau´de executado por profissionais brasileiros, mas nenhuma dessas fer-
ramentas pesquisadas durante a elaborac¸a˜o deste trabalho apresentam mecanismos de consultas
satisfato´rios, pois na˜o fornecem informac¸o˜es relevantes com relac¸a˜o aos medicamentos permiti-
dos pela ANVISA no sentido de detalhar as associac¸o˜es com outros medicamentos, mostrando
a ocorreˆncia de reac¸o˜es adversas, interac¸o˜es medicamentosas, contraindicac¸o˜es me´dicas, ad-
verteˆncias e precauc¸o˜es entre eles.
1.3 OBJETIVOS
1.3.1 Objetivo geral
Desenvolver uma metodologia computacional baseada em te´cnicas de minerac¸a˜o de
textos para analisar as bulas disponibilizadas no site da ANVISA, tambe´m implementar um
sistema web que facilite a busca por medicamentos registrados neste o´rga˜o regulador e as
informac¸o˜es associadas a eles, como por exemplo, interac¸o˜es medicamentosas e contraindicac¸o˜es
condicionadas a restric¸o˜es de pesquisa dos usua´rios.
26
1.3.2 Objetivos especı´ficos
Os objetivos especı´ficos deste trabalho sa˜o:
• estudar e utilizar processos para obtenc¸a˜o das bulas dos medicamentos;
• tratamento dos arquivos das bulas, conversa˜o de PDF em arquivo texto e tratar imagens
deste arquivo;
• organizac¸a˜o dos to´picos no texto da bula profissional;
• identificac¸a˜o de termos relevantes entre os to´picos dos medicamentos;
• mapeamento das ontologias biome´dicas do SNOMED-CT (COˆTE´; PATHOLOGISTS;
ASSOCIATION, 1993);
• tratamento das redes de interac¸o˜es entre fa´rmacos do DrugBank (WISHART et al., 2008);
• elaborac¸a˜o do modelo de banco de dados baseado em grafos, em que utiliza-se a ferra-
menta Neo4j (NEO4J, 2014).
1.4 ORGANIZAC¸A˜O DO TRABALHO
Este trabalho esta´ organizado em 6 capı´tulos, sendo que o primeiro capı´tulo remete-se
a introduc¸a˜o que apresenta a contextualizac¸a˜o, motivac¸a˜o e justificativa, objetivos e organizac¸a˜o
do trabalho. Os pro´ximos capı´tulos esta˜o conforme a seguinte estrutura:
• Caracterizac¸a˜o dos problemas: neste capı´tulo sa˜o apresentados detalhadamente os pro-
blemas e os desafios computacionais deste trabalho. Sa˜o detalhados os problemas en-
contrados ao utilizar bula como fonte de informac¸a˜o e a integrac¸a˜o de informac¸o˜es entre
diferentes bases de dados;
• Referencial teo´rico: neste capı´tulo sa˜o apresentados os estudos e as tecnologias utiliza-
das. Os vocabula´rios e ferramentas da a´rea de sau´de, te´cnicas de minerac¸a˜o de textos,
bases de dados da biomedicina e tecnologia aplicada para banco de dados baseado em
grafo;
• Materiais e me´todos: neste capı´tulo sa˜o apresentadas as etapas do workflow implemen-
tado para a estruturac¸a˜o das bulas me´dicas da ANVISA e a integrac¸a˜o dessas com outras
bases de dados;
27
• Resultados e discussa˜o: neste capı´tulo sa˜o apresentados os resultados obtidos e a ana´lise
das estatı´sticas contabilizadas pelos usua´rios que utilizaram as ferramentas disponibiliza-
das no Fa´cil Bula;
• Considerac¸o˜es finais: neste capı´tulo detalham-se as considerac¸o˜es finais do trabalho
desenvolvido e os trabalhos futuros planejados para continuidade do projeto Fa´cil Bula.
28
29
2 CARACTERIZAC¸A˜O DOS PROBLEMAS
Este capı´tulo apresenta como a bula me´dica publicada na ANVISA esta´ redigida e
organizada seguindo um conjunto de normas te´cnicas. A bula e´ um meio de disponibilizar
informac¸o˜es consideradas essenciais sobre os medicamentos tanto para os profissionais quanto
para os pacientes leigos. Nas bulas esta˜o presentes, por exemplo, informac¸o˜es que dizem res-
peito aos cuidados sobre contraindicac¸o˜es, adverteˆncias e precauc¸o˜es, interac¸o˜es medicamen-
tosas e reac¸o˜es adversas.
O presente capı´tulo tambe´m descreve os problemas que foram abordados, como:
• o processamento textual das bulas;
• a integrac¸a˜o do conteu´do das bulas com outras bases de informac¸o˜es;
• as dificuldades encontradas por meio da utilizac¸a˜o da bula profissional como fonte de
informac¸a˜o.
2.1 BULAS ME´DICAS
A bula me´dica esta´ disponı´vel na ANVISA em duas verso˜es: (i) paciente e (ii) pro-
fissional. A versa˜o direcionada ao paciente possui uma escrita mais simples voltada para o
entendimento do pu´blico em geral. Para a versa˜o profissional, sa˜o apresentadas informac¸o˜es
mais completas e termos mais especı´ficos da a´rea de sau´de.
A elaborac¸a˜o da bula segue va´rias regras definidas em leis e resoluc¸o˜es que sa˜o elabo-
radas pelo Governo com participac¸a˜o dos seus o´rga˜os relacionados. Destacam-se as normas pre-
sentes na Resoluc¸a˜o-RDC No 47, de 8 de setembro de 2009 da ANVISA, criadas para auxiliar
na elaborac¸a˜o e publicac¸a˜o da bula me´dica (ANVISA, 2009). Nestas normas sa˜o apresentadas
as estruturas do conteu´do da bula organizadas em to´picos, como: composic¸a˜o, indicac¸a˜o, resul-
tados de efica´cia, caracterı´sticas farmacolo´gicas, contraindicac¸a˜o, adverteˆncias e precauc¸o˜es,
interac¸o˜es medicamentosas, cuidados de armazenamento do medicamento, reac¸o˜es adversas,
posologia e superdose. Os to´picos da bula teˆm o objetivo de informar os pacientes quanto ao
medicamento e evitar possı´veis riscos que o seu uso incorreto pode ocasionar, informar aos pro-
fissionais a forma de apresentac¸a˜o do medicamento e as possı´veis interac¸o˜es deste com outros
medicamentos, alimentos e ate´ mesmo cuidados relacionados a idade, geˆnero e doenc¸as. Con-
tudo, a quantidade de informac¸o˜es disponibilizadas e´ volumosa e todo este conteu´do e´ de difı´cil
30
consulta, ou seja, torna a ana´lise deste conhecimento um processo trabalhoso.
No pro´prio sı´tio web da ANVISA e´ disponibilizado uma pa´gina conhecida por Bula´rio
Eletroˆnico1, em que sa˜o encontrados os arquivos das bulas profissionais dos medicamentos
disponibilizados pelas empresas responsa´veis, permitindo o acesso a informac¸o˜es sobre os me-
dicamentos ao pu´blico em geral. Apesar do Bula´rio Eletroˆnico da ANVISA disponibilizar as
bulas profissionais dos medicamentos distribuı´dos no Brasil, estas infelizmente possuem pouca
padronizac¸a˜o. Por exemplo, algumas bulas possuem um determinado padra˜o de to´picos, ja´ ou-
tras que seguem diferentes padronizac¸o˜es, ale´m de existirem apenas imagens digitalizadas da
versa˜o fı´sica da bula. Obter conhecimento destas fontes de dados torna-se uma tarefa trabalhosa,
visto os obsta´culos gerados pela falta de padronizac¸a˜o das bulas, por erros ortogra´ficos nos tex-
tos, pluralizac¸a˜o de palavras ou pelo uso do novo acordo ortogra´fico da Lı´ngua Portuguesa por
algumas empresas que apresentam alterac¸o˜es no nome do to´pico e pelo uso de imagens da bula
em sua versa˜o fı´sica, dificultando assim o acesso a` informac¸a˜o.
Ale´m dos problemasestruturais no arquivo das bulas, e´ importante conhecer que o
uso concomitante de medicamentos podem causar interac¸o˜es medicamentosas (EDWARDS;
ARONSON, 2000). Dessa forma, entende-se, como por exemplo, que a administrac¸a˜o de
um medicamento pode minimizar a efica´cia de um outro medicamento, gerando assim uma
possı´vel demora no tratamento, ale´m de poder ocasionar outros problemas como: reac¸o˜es
adversas, alergias, agravamento de doenc¸as ja´ existentes, intoxicac¸o˜es, podendo ate´ levar a`
morte (EDWARDS; ARONSON, 2000).
Nesse cena´rio, ha´ outras complexidades existentes como a identificac¸a˜o dos to´picos
das bulas, na qual a segmentac¸a˜o destas informac¸o˜es permite identificar possı´veis interac¸o˜es
medicamentosas ale´m de informac¸o˜es quanto a cuidados especiais na administrac¸a˜o do medi-
camento a alguns pacientes, como para gra´vidas, crianc¸as, entre outros.
Um dos problemas aqui abordado pode ser exemplificado da seguinte maneira: ima-
gine que uma determinada pessoa de idade avanc¸ada utiliza um conjunto de medicamentos,
cada qual responsa´vel por controlar e/ou tratar determinada(s) doenc¸a(s), ou ainda suprir a falta
de alguma substaˆncia para o organismo. Considerando que esta pessoa seja diagnosticada com
uma nova doenc¸a, como por exemplo, a doenc¸a de Alzheirmer. Como saber se o medicamento
prescrito para essa doenc¸a rece´m diagnosticada na˜o afeta ou e´ afetada pela medicac¸a˜o ja´ pres-
crita e sendo utilizada pelo paciente? Como o profissional da a´rea de sau´de identificara´ essas
informac¸o˜es? Um dos procedimentos mais usuais utilizados por estes profissionais e´ conhecer
as informac¸o˜es presentes nas bulas profissionais dos medicamentos.
1htt p : //www.anvisa.gov.br/ f ila bula/
31
Os to´picos contraindicac¸o˜es, adverteˆncias e precauc¸o˜es, interac¸o˜es medicamentosas,
reac¸o˜es adversas encontrados nas bulas profissionais do medicamento sera˜o detalhados nas
subsec¸o˜es seguintes.
2.1.1 Contraindicac¸o˜es
Na redac¸a˜o da bula ha´ um to´pico especı´fico para apresentar as contraindicac¸o˜es do
medicamento seguindo norma estabelecida pela Resoluc¸a˜o-RDC No 47 da ANVISA. De acordo
com a Sec¸a˜o III, Artigo 4o, Inciso VIII dessa resoluc¸a˜o o to´pico contraindicac¸o˜es tem o objetivo
de mostrar condic¸o˜es ou situac¸o˜es em que se deve evitar o uso do medicamento, em que caso
estas condic¸o˜es na˜o sejam observadas podera´ acarretar efeitos a` sau´de do usua´rio ou mesmo
leva´-lo a o´bito (ANVISA, 2009).
A fim de exemplificar a importaˆncia do to´pico contraindicac¸a˜o, da mesma forma que o
conhecimento do conteu´do deste e tambe´m de outros to´picos, foram selecionadas as Figuras 1 e
2. Estas figuras apresentam uma situac¸a˜o em que a utilizac¸a˜o do medicamento Eranz (indicado
para doenc¸a de Alzheimer) junto ao medicamento Kolantyl (indicado para alı´vio de azia e ma´
digesta˜o) e´ contraindicada.
Figura 1 – Termo demeˆncia de Alzheimer encontrado no to´pico de indicac¸o˜es do me-
dicamento Eranz.
Fonte: Adaptado de (ANVISA, 2013).
Dessa forma, a Figura 1 mostra o to´pico indicac¸o˜es do medicamento Eranz, disponibi-
lizado pela empresa farmaceˆutica Wyeth Indu´stria Farmaceˆutica Ltda. Este to´pico informa para
qual doenc¸a o medicamento e´ indicado e pela figura identifica-se que o medicamento Eranz e´
indicado para tratamento da doenc¸a de Alzheimer.
A identificac¸a˜o e o conhecimento dos respectivos termos de cada to´pico da bula me´dica
da˜o suporte a` criac¸a˜o do banco de dados baseado em grafos, por serem informac¸o˜es altamente
interligadas conforme visualiza-se pela Figura 2.
A Figura 2 apresenta o to´pico de contraindicac¸o˜es do medicamento Kolantyl, disponi-
32
Figura 2 – To´pico de contraindicac¸o˜es do medicamento Kolantyl, que e´ contraindi-
cado para pacientes em tratamento da doenc¸a de Alzheimer.
Fonte: Adaptado de (ANVISA, 2013).
bilizado pela Medley Indu´stria Farmaceˆutica Ltda. Na Figura 2 identifica-se que o medicamento
Kolantyl e´ contraindicado para todos que tenham doenc¸a de Alzheimer, por causa do alumı´nio
que pode agravar a doenc¸a.
Por fim, conclui-se pela ana´lise das informac¸o˜es presentes nas Figuras 1 e 2 que na˜o
se pode administrar o medicamento Kolantyl em qualquer pessoa que tenha Alzheimer, visto o
grifo em azul sobre a contraindicac¸a˜o do Kolantyl apresentada na Figura 2.
2.1.2 Adverteˆncias e precauc¸o˜es
Pela Resoluc¸a˜o-RDC No 47 da ANVISA e´ indicado a obrigatoriedade do to´pico ad-
verteˆncias e precauc¸o˜es na redac¸a˜o das bulas. Conforme diz a Sec¸a˜o III, Artigo 4o, Inciso I desta
resoluc¸a˜o, este to´pico apresenta cuidados na utilizac¸a˜o do medicamento para prevenir agravos
a` sau´de e tambe´m indicar a limitac¸a˜o do uso desse medicamento, mas que na˜o o contraindi-
que (ANVISA, 2009).
A Figura 3 apresenta o texto do to´pico indicac¸o˜es do medicamento Furp-Estreptomicina,
disponibilizado pela Fundac¸a˜o para o Reme´dio Popular, e o conteu´do do to´pico adverteˆncias e
precauc¸o˜es do medicamento Mud Oral, fornecido pela Eurofarma Laborato´rios S/A. A Figura 3
33
Figura 3 – To´pico indicac¸a˜o do medicamento Furp-Estreptomicina destinado ao tra-
tamento de tuberculose e o to´pico adverteˆncias e precauc¸o˜es do medicamento Mud
Oral que informa o cuidado para pacientes com tuberculose.
Fonte: Adaptado de (ANVISA, 2013).
destaca em vermelho que o medicamento Furp-Estreptomicina e´ indicado para tratamento da
tuberculose, entretanto o termo tuberculose e´ encontrado no to´pico adverteˆncias e precauc¸o˜es
do medicamento Mud Oral.
Nota-se pelo exemplo da Figura 3 que ha´ uma limitac¸a˜o do medicamento Mud Oral
para quem tem tuberculose. Isso porque o Mud Oral tem um corticoide em sua formulac¸a˜o,
que pode diminuir as defesas do organismo contra os microrganismos, e assim pode favorecer
o desenvolvimento da tuberculose. O uso de Mud Oral deve ser cauteloso em pacientes com
tuberculose, que fac¸am, por exemplo, uso do Furp-Estreptomicina.
2.1.3 Interac¸o˜es medicamentosas
Segundo a Resoluc¸a˜o-RDC No 47 da ANVISA, consoante ao que rege a Sec¸a˜o III, Ar-
tigo 4o, Inciso XXVIII, o to´pico interac¸o˜es medicamentosas define um resposta farmacolo´gica
ou clı´nica causada pela interac¸a˜o de: (i) medicamento-medicamento; (ii) medicamento-alimento;
34
(iii) medicamento-substaˆncia quı´mica; (iv) medicamento-exame laboratorial e na˜o laboratorial;
(v) medicamento-planta medicinal; e (vi) medicamento-doenc¸a, cujo resultado final pode ser
a alterac¸a˜o dos efeitos desejados pela utilizac¸a˜o do medicamento ou a ocorreˆncia de eventos
adversos (ANVISA, 2009).
Desse modo, atende-se que estabelecida a consulta por certos medicamentos para
administrac¸a˜o de um paciente, existe a importaˆncia em verificar se a administrac¸a˜o de um novo
medicamento pode levar a uma interac¸a˜o medicamentosa, em um paciente que ja´ faz o uso de
va´rios medicamentos.
Figura 4 – A carbamazepina interage com o cloridrato de ioimbina, princı´pio ativo do
Yomax.
Fonte: Adaptado de (ANVISA, 2013).
O cuidado na administrac¸a˜o de medicamentos e tambe´m para o tratamento de paci-
entes e´ exemplificado pela Figura 4 que destaca em vermelho a carbamazepina encontrado na
formu´la do medicamento Carbamazepina disponibilizado pela Unia˜o Quı´mica Farmaceˆutica
Nacional S/A, que possui interac¸o˜es medicamentosas com o medicamento Yomax da Apsen
Farmaceˆutica S/A. Pela Figura 4 conclui-se que o uso destes medicamentos concomitantemente
na˜o e´ indicado, visto as informac¸o˜es da bula do medicamento Yomax.
35
2.1.4 Reac¸o˜es adversas
Em concordaˆncia a` Sec¸a˜o III, Artigo 4o, Inciso XXXI presente na Resoluc¸a˜o-RDC
No 47 da ANVISA, o to´pico reac¸o˜es adversas e´ destinado a informar sobre respostas a um
medicamento que seja prejudicialou na˜o-intencional e que ocorra nas doses normalmente utili-
zadas (ANVISA, 2009).
Com a finalidade de exemplificar o to´pico reac¸o˜es adversas, a Figura 5 destaca em
vermelho o fa´rmaco fenobarbital encontrado no to´pico composic¸a˜o do medicamento Gardenal
disponibilizado pela Sanofi-aventis Farmaceˆutica Ltda., pore´m este fa´rmaco foi encontrado no
to´pico de reac¸o˜es adversas do medicamento Dacarbazina do Laborato´rio Quı´mico Farmaceˆutico
Be´rgamo Ltda.
Figura 5 – O fa´rmaco fenobarbital encontrado na composic¸a˜o do medicamento Gar-
denal tem reac¸a˜o adversa com o medicamento Dacarbazina.
Fonte: Adaptado de (ANVISA, 2013).
Desse modo, identifica-se pela Figura 5 que o uso de fenobarbital em quem faz uso de
dacarbazina, ajuda a diminuir os sintomas de voˆmito.
2.2 INTEGRAC¸A˜O ENTRE BASES
O Bula´rio Eletroˆnico da ANVISA na˜o disponibiliza a organizac¸a˜o dos fa´rmacos, nem
das doenc¸as que as bulas informam de uma maneira que facilite a pesquisa pelos profissionais
da a´rea de sau´de. Dessa forma, ha´ a necessidade da pesquisa por outras fontes de dados que
36
fornec¸am termos referentes aos fa´rmacos e tambe´m a`s doenc¸as que sa˜o encontrados nas bulas
me´dicas. O estudo das bases internacionais utilizadas para integrac¸a˜o do Bula´rio Eletroˆnico
esta´ presente na Sec¸a˜o 3.7.
Ha´ diversas dificuldades vinculadas para integrac¸a˜o de outras bases com as bulas do
Bula´rio Eletroˆnico, como:
• organizac¸a˜o do texto da bula na˜o possui uma padronizac¸a˜o das informac¸o˜es disponibi-
lizadas. Algumas empresas farmaceˆuticas redigem o texto do seu medicamento de uma
maneira diferente do que e´ exigido pelas normas vigentes da ANVISA;
• dificuldades existentes nos arquivos das bulas em PDF geradas por meio dos erros or-
togra´ficos, na˜o adequac¸a˜o ao novo acordo ortogra´fico da Lı´ngua Portuguesa, entre outros;
• irrelevaˆncia de termos Ontolo´gicos presentes no conteu´do da bula. O texto e´ composto
por diversas palavras, pore´m ha´ muitas que esta˜o no conteu´do do texto para dar sentido
ao leitor e na˜o referenciam termos de doenc¸as, fa´rmacos ou medicamentos;
• classificac¸a˜o entre os termos de doenc¸as. Identificar desde o termo mais gene´rico ate´ o
mais especı´fico.
Estas dificuldades listadas sera˜o exemplificadas nas subsec¸o˜es seguintes.
2.2.1 Organizac¸a˜o do texto
As bulas possuem informac¸o˜es completas sobre os medicamentos fabricados pelas em-
presas farmaceˆuticas, pore´m o texto disponibilizado consta num u´nico arquivo PDF respectivo
a cada medicamento. Os dados presentes nestes arquivos na˜o esta˜o normalizados, desse modo,
ha´ na bula va´rios to´picos que dizem respeito a cada assunto especı´fico dos medicamentos.
A Figura 6 apresenta a divisa˜o de alguns to´picos encontrados no arquivo PDF da bula
profissional do medicamento Cataflam, que e´ disponibilizado pela empresa farmaceˆutica No-
vartis Biocieˆncias Ltda. Pela figura, cujo medicamento foi encontrado no Bula´rio Eletroˆnico da
ANVISA, os seguintes to´picos foram identificados e destacados em vermelho: (i) Apresentac¸a˜o,
(ii) Composic¸a˜o, e (iii) Indicac¸o˜es, que informam respectivamente sobre o nome do medica-
mento e sua forma farmaceˆutica, sobre quais princı´pios ativo e excipientes esta˜o presentes no
medicamento, e sobre para qual tratamento o medicamento e´ indicado.
37
Figura 6 – Alguns to´picos encontrados na bula do medicamento Cataflam.
Fonte: Adaptado de (ANVISA, 2013).
2.2.2 Dificuldades com a fonte de informac¸a˜o
A redac¸a˜o e publicac¸a˜o das bulas pelas empresas farmaceˆuticas devem seguir as leis e
resoluc¸o˜es criadas pelo governo e pela ANVISA. Estas empresas na˜o disponibilizam um docu-
mento estruturado e uniforme de suas bulas, dado a quantidade de problemas encontrados com
o processamento desta fonte de informac¸a˜o, como: falta de padronizac¸a˜o na nomenclatura dos
to´picos, erros ortogra´ficos, pluralizac¸a˜o dos to´picos, novo acordo ortogra´fico da Lı´ngua Portu-
guesa e disponibilizac¸a˜o da imagem fı´sica da bula, ao inve´s da digitalizac¸a˜o do documento.
Um exemplo sobre a falta de padronizac¸a˜o entre os to´picos das bulas e´ apresentada na
Figura 7 e destacada em vermelho. A Figura 7 mostra as diferentes formas de escrita referentes
ao to´pico de superdosagem encontrada nos medicamentos Betnovate N da GlaxoSmithKline
Brasil Ltda., Brilinta da Astrazeneca do Brasil Ltda. e Ozonyl do Laborato´rio Gross S/A. Na
bula Betnovate N, o to´pico e´ escrito de maneira enumerada com o tı´tulo superdose, ja´ o me-
dicamento Brilinta possui tambe´m uma enumerac¸a˜o de to´pico, pore´m o tı´tulo e´ escrito como
superdose, e por fim, em Ozonyl na˜o e´ encontrada nenhuma enumerac¸a˜o e o tı´tulo descreve o
significado da palavras superdosagem de maneira interrogativa. Na Figura 7, tambe´m pode ser
verificada a diferenc¸a na forma de escrita, atrelada a` fonte utilizada e no tamanho da letra, como
tambe´m pelo espac¸amento utilizado na redac¸a˜o de cada bula.
Outro problema encontrado e´ descrito por incoereˆncias na escrita das bulas do Bula´rio
Eletroˆnico da ANVISA, conforme visualiza-se pela Figura 8. A Figura 8 mostra um erro or-
38
Figura 7 – Variac¸o˜es de tı´tulos encontrados para o to´pico superdose dos medicamentos
Betnovate, Brilinta e Ozonyl.
Fonte: Adaptado de (ANVISA, 2013).
Figura 8 – Erro ortogra´fico encontrado no medicamento Setronax.
Fonte: Adaptado de (ANVISA, 2013).
togra´fico destacado em vermelho no to´pico de identificac¸a˜o do medicamento Setronax elabo-
rado pela Aspen Pharma Indu´stria Farmaceˆutica Ltda., na qual a palavra medicamento conte´m
erro em sua escrita.
A Figura 9 exibe em vermelho as diferentes maneiras de escrita do to´pico de formas
39
Figura 9 – To´pico do medicamento Ebastel escrito no plural, mas para o medicamento
Norfloxacino foi encontrado no singular.
Fonte: Adaptado de (ANVISA, 2013).
farmaceˆuticas e apresentac¸a˜o dos medicamentos Ebastel da Eurofarma Laborato´rios S/A e o
Norfloxacino da Unia˜o Quı´mica Farmaceˆutica Nacional S/A, em que respectivamente o to´pico
e´ encontrado escrito no plural e para o outro medicamento esta´ no singular.
Figura 10 – To´pico do medicamento Finagripe escrito conforme o novo acordo or-
togra´fico da Lı´ngua Portuguesa, diferente do to´pico encontrado no medicamento Gre-
tivit que esta´ escrito segundo o antigo acordo.
Fonte: Adaptado de (ANVISA, 2013).
Tambe´m ha´ como problema a relac¸a˜o de algumas empresas utilizarem o novo acordo
ortogra´fico da Lı´ngua Portuguesa para redac¸a˜o das bulas, mas em contrapartida por outras em-
presas ainda e´ aplicado o antigo acordo. Dessa forma, a Figura 10 destaca em vermelho o
to´pico contraindicac¸a˜o do medicamento Finagripe da Medquı´mica Indu´stria Farmaceˆutica S/A,
40
que esta´ escrito conforme o novo acordo ortogra´fico, pore´m no medicamento Gretivit disponi-
bilizado pela Belfar Ltda. esta´ em conformidade com as regras do antigo acordo.
Figura 11 – Imagem da bula fı´sica do medicamento Manitol adicionado ao arquivo
PDF e na˜o digitalizado.
Fonte: Adaptado de (ANVISA, 2013).
A Figura 11 apresenta a imagem da bula fı´sica do medicamento Manitol disponibi-
lizado pela Beker Produtos Fa´rmaco Hospitalares Ltda. encontrado no Bula´rio Eletroˆnico da
ANVISA. Pela Figura 11 verifica-se que apenas a imagem da bula fı´sica foi adicionada ao ar-
quivo PDF, ao inve´s desta ser digitalizada, conforme esta´ disponı´vel em outras bulas. Desse
modo, visualiza-se a baixa qualidade para leitura das informac¸o˜es deste medicamento, com
letras pequenas de difı´cil visualizac¸a˜o e a falta de alinhamento do texto, ale´m de requerer a
realizac¸a˜o de um processo de reconhecimento de caracteres a partir da imagem desta bula para
identificac¸a˜o de todo o conteu´do do medicamento.2.2.3 Irrelevaˆncia de termos Ontolo´gicos
Figura 12 – Termos relacionados a fa´rmacos encontrados no to´pico composic¸a˜o da
bula do medicamento Cataflam.
Fonte: Adaptado de (ANVISA, 2013).
Identificar os termos relevantes de cada to´pico da bula profissional do medicamento,
como por exemplo, mapear os fa´rmacos encontrados no to´pico composic¸a˜o, e tambe´m encontrar
termos referentes a`s doenc¸as, bem como a classificac¸a˜o destas nesses to´picos sa˜o tarefas que
contribuem com a identificac¸a˜o de termos realmente importantes presentes no texto. Ha´ no
texto das bulas muitas palavras, como: artigos, adjetivos, adve´rbios, conjunc¸o˜es, numerais,
41
preposic¸o˜es, pronomes e verbos, que sa˜o importantes para dar contexto e entendimento para
leitura do conteu´do das informac¸o˜es do medicamento, pore´m para a identificac¸a˜o de termos
relevantes na˜o e´ importante que sejam utilizadas estas palavras. O mapeamento dos termos e´
tambe´m u´til para guiar as consultas aos bancos de dados (MEIJ et al., 2011), pois apresenta a
normalizac¸a˜o de dados e assim auxilia na estrutura desenvolvida para a base de dados.
A importaˆncia de conhecer os termos relevantes de cada to´pico e´ apresentado na Fi-
gura 12 que exemplifica a identificac¸a˜o de fa´rmacos no to´pico composic¸a˜o do medicamento
Cataflam, desenvolvido pela Novartis Biocieˆncias Ltda. Nesta figura encontra-se o fa´rmaco di-
clofenaco a´cido indicado como princı´pio ativo, e informac¸o˜es sobre seu fa´rmaco equivalente,
que no caso e´ o diclofenaco pota´ssico. Tambe´m sa˜o encontradas informac¸o˜es sobre os excipien-
tes, que sa˜o componentes sem ac¸a˜o farmacolo´gica, e que sa˜o utilizadas como veı´culo para ac¸a˜o
do princı´pio ativo, sendo estes: celulose microcristalina, amidoglicolato de so´dio, laurilsulfato
de so´dio, dio´xido de silı´cio, a´cido estea´rico e talco.
2.2.4 Classificac¸a˜o entre os termos de doenc¸as
Figura 13 – Termo doenc¸a cardı´aca encontrado no medicamento Afrin que repre-
senta um conjunto de doenc¸as relacionadas, diferente do medicamento Cefaliv que
apresenta o termo infarto do mioca´rdio relacionado a uma doenc¸a mais especı´fica.
Fonte: Adaptado de (ANVISA, 2013).
O vocabula´rio da a´rea de sau´de e´ vasto, sendo composto por va´rios termos me´dicos
e pela comunicac¸a˜o dos consumidores em geral (ZENG-TREITLER et al., 2008). Ha´ nes-
tes termos me´dicos a especializac¸a˜o de vocabula´rios relacionados as doenc¸as que, por vezes,
42
especificam um grupo de doenc¸as relacionadas. Ou seja, quando um termo esta´ associado a
doenc¸a do sistema respirato´rio entende-se que este engloba outras doenc¸as como: pneumonia,
bronquite, asma entre outros.
E´ identificado que, como por exemplo, se em uma determinada bula conter no to´pico de
contraindicac¸a˜o problemas relacionadas a`s doenc¸as cardı´acas, um certo paciente que tenha in-
farto do mioca´rdio na˜o podera´ ter este medicamento prescrito em seu histo´rico clı´nico. Tambe´m
ha´ de se identificar nas bulas caso um determinado fa´rmaco possa potencializar a ac¸a˜o de outro
ou minimizar sua efica´cia (BIGUETTI; ANDRADE, 2014).
Dessa maneira, a Figura 13 destaca em vermelho os diferentes termos relacionados
a`s doenc¸as que foram encontrados no medicamento Afrin da Hypermarcas S/A e Cefaliv da
Ache´ Laborato´rios Farmaceˆuticos S/A. Pela Figura 13 visualiza-se que o medicamento Afrin
e´ contraindicado para uso por pacientes com doenc¸as cardı´acas, este termo tem relac¸a˜o com
um conjunto de doenc¸as especı´ficas que e´ o caso do termo infarto do mioca´rdio, encontrado no
medicamento Cefaliv. Entende-se assim que no caso de um paciente com infarto do mioca´rdio
o uso do medicamento Afrin e´ contraindicado, pois este termo faz parte do conjunto de doenc¸as
cardı´acas.
43
3 REFERENCIAL TEO´RICO
Este capı´tulo apresenta alguns conceitos utilizados para a execuc¸a˜o deste trabalho.
Todas as sec¸o˜es esta˜o organizadas em:
• na Sec¸a˜o 3.1 sa˜o apresentados os trabalhos relacionados com o projeto desenvolvido;
• na Sec¸a˜o 3.2 sa˜o apresentados os conceitos de farma´cia para facilitar o entendimento do
Bula´rio Eletroˆnico e do conteu´do das bulas profissionais;
• as Sec¸o˜es 3.3 e 3.4 apresentam o estudo sobre os o´rga˜os reguladores de medicamentos dos
Estados Unidos (FDA) e do Brasil (ANVISA). Sera˜o apresentadas as responsabilidades
desses e alguns programas disponibilizados por cada organizac¸a˜o;
• na Sec¸a˜o 3.5 sa˜o apresentadas as te´cnicas de minerac¸a˜o de textos para o processamento
das bulas profissionais da ANVISA;
• na Sec¸a˜o 3.6 sa˜o apresentadas refereˆncias sobre a aplicac¸a˜o de banco de dados baseado
em grafos e as caracterı´sticas da tecnologia Neo4j;
• a Sec¸a˜o 3.7 detalhamento sobre variados bancos de dados da biomedicina, a fim de inte-
grar estas bases com as informac¸o˜es processadas das bulas profissionais.
3.1 TRABALHOS RELACIONADOS
O estudo sobre os medicamentos e suas interac¸o˜es e´ relevante, visto que o medica-
mento pode ter tanto o efeito deseja´vel (bene´fico), quanto respostas desfavora´veis ou inde-
sejados (efeitos adversos), ou apresentar um pequeno significado clı´nico para o quadro dos
pacientes (SECOLI, 2001). A importaˆncia do tema interac¸o˜es entre medicamentos para o de-
senvolvimento do trabalho e´ justificado por trabalhos (SEHN et al., 2003; MOURA; RIBEIRO;
STARLING, 2007; JU´NIOR et al., 2009; BUENO et al., 2010) que apresentam os problemas
relacionados com a sau´de e tambe´m medidas para reduc¸a˜o destes problemas.
Assim, ha´ dois trabalhos publicados no comec¸o do ano de 2015 (WALLACE; PA-
AUW, 2015; SUN, 2015), que demonstram o interesse e importaˆncia em relac¸a˜o ao estudo de
redes de interac¸o˜es entre medicamentos. O primeiro apresenta o problema da utilizac¸a˜o de
va´rios medicamentos em idosos e aponta a importaˆncia das redes de interac¸o˜es entre drogas e
doenc¸as. Este trabalho demonstrou que a quantidade de efeitos adversos aumenta de forma na˜o
44
linear a` medida que novos medicamentos sa˜o adicionados no tratamento (WALLACE; PAAUW,
2015). O segundo descreve uma metodologia para a construc¸a˜o de uma rede de interac¸o˜es
com mu´ltiplos nı´veis incluindo fa´rmacos, doenc¸as e genes (SUN, 2015), e mostrou algumas
propriedades, como genes relacionados a doenc¸as e a resposta dos medicamentos a determina-
dos genes, na qual a compreensa˜o de conceitos da a´rea de redes complexas representada por
fa´rmacos-doenc¸as-genes influencia na aplicac¸a˜o farmaceˆutica e no tratamento de doenc¸as.
Existem tambe´m alguns trabalhos que fundamentam o uso de te´cnicas para minerac¸a˜o
de dados em aplicac¸o˜es voltadas para a´rea de sau´de, como a abordagem de (YOON et al.,
2012), em que os autores propuseram um roteiro quantitativo para detecc¸a˜o de reac¸o˜es adver-
sas a medicamentos por meio de registros eletroˆnicos de sau´de dos pacientes. Ja´ no trabalho
de (LIU et al., 2012), e´ utilizado um algoritmo de minerac¸a˜o de dados para identificar regras de
associac¸o˜es entre os medicamentos encontrados em conjunto de registros me´dicos eletroˆnicos.
Definidas estas associac¸o˜es sa˜o aplicadas metodologias computacionais para interac¸o˜es en-
tre as regras, sendo possı´vel descobrir falhas na administrac¸a˜o concomitante de determinados
fa´rmacos. Uma soluc¸a˜o pro´xima a apresentada em (LIU et al., 2012) e´ encontrada no trabalho
de (RHO et al., 2013), em que os autores propo˜em te´cnicas de minerac¸a˜o em banco de dados
de contraindicac¸o˜es me´dicas para apresentar regras de associac¸o˜es entre os medicamentos.
Seguindo estas abordagens destacam-se os artigos do PharmGKB1, ambiente web que
disponibiliza va´rios recursos sobre o impacto de variac¸o˜es gene´ticas humanas em resposta aos
fa´rmacos para conhecimento de clı´nicos e pesquisadores.Entre as publicac¸o˜es apresentadas
pela pa´gina, detalha-se o trabalho de (COULET et al., 2010), que utiliza Processamento de Lin-
guagem Natural (PLN) para extrair domı´nios especı´ficos das publicac¸o˜es de uma base de dados
relacionada ao tema Farmacogenoˆmica. O tema Farmacogenoˆmica e´ o estudo da disposic¸a˜o e
efeitos dos fa´rmacos em que fornece uma base cientı´fica mais so´lida para otimizar a terapia des-
ses com base na constituic¸a˜o gene´tica de cada paciente (EVANS; RELLING, 1999), utilizando
regras definidas a` ma˜o e ontologias de domı´nios especı´ficos para melhorar o desempenho do
PLN.
Neste contexto, ha´ o trabalho de (DAVIS et al., 2009) que apresenta uma base gratuita
e curada de nome Comparative Toxicogenomics Database2 (CTD), que fornece a compreensa˜o
de efeitos quı´micos na sau´de humana, mediante interac¸o˜es quı´micas de genes e os relaciona-
mentos a`s doenc¸as com base na literatura, todo o conhecimento gerado nesta publicac¸a˜o forma
uma rede quı´mica-gene-doenc¸a. Dessa forma, relaciona-se a FDA3, que e´ um o´rga˜o governa-
mental dos Estados Unidos da Ame´rica responsa´vel pelo controle de alimentos, medicamentos,
1htt ps : //www.pharmgkb.org/
2htt p : //ctdbase.org/downloads/
3htt p : //www. f da.gov/
45
equipamentos me´dicos, entre outros. Este o´rga˜o oferece uma base de dados de reac¸o˜es adversas
concebida por meio do FDA Adverse Event Reporting System (FAERS) (FAERS, 2015).
Por ser uma fonte de informac¸a˜o brasileira e pouco conhecida internacionalmente, e´
pouco prova´vel que estes projetos utilizem as bulas me´dicas disponı´veis no sı´tio web da AN-
VISA. Durante a escrita desta dissertac¸a˜o na˜o foram encontrados trabalhos que abordassem
te´cnicas para identificar regras de associac¸o˜es entre medicamentos utilizando as reac¸o˜es ad-
versas, adverteˆncias e precauc¸o˜es, contraindicac¸o˜es e interac¸o˜es medicamentosas constantes no
conteu´do destas bulas.
As bulas da ANVISA disponı´veis no Bula´rio Eletroˆnico apresentam informac¸o˜es rela-
cionadas ao FDA, pore´m na˜o seguem igualmente a organizac¸a˜o de informac¸o˜es sobre fa´rmacos
e doenc¸as entre medicamentos em forma de cruzamento de informac¸o˜es. A fim de organi-
zar as informac¸o˜es disponibilizadas no Bula´rio Eletroˆnico, o foco deste projeto estrutura as
informac¸o˜es dos medicamentos comercializados e permitidos pela ANVISA por meio de bases
consolidadas (DrugBank e SNOMED-CT) e confia´veis utilizadas pelas ferramentas pesquisa-
das, juntamente com trabalhos estudados, e assim busca atender o trabalho dos profissionais de
sau´de brasileiros.
46Tabela 1 – Comparac¸a˜o das ferramentas relacionadas pesquisadas.
Aplicabilidade das ferramentas pesquisadas
Nome
Interac¸o˜es
medicamentosas
por cruzamento
de informac¸o˜es
Detalhes de
medicamentos
Busca de
doenc¸as
Apresenta
prec¸o
Informac¸o˜es de
medicamentos
comercializados
no Brasil
Informac¸o˜es de
reac¸o˜es adversas
por cruzamento
de informac¸o˜es
Filtro por
classes
terapeˆuticas
Filtro por
princı´pio
ativo
Indica
medicamento
gene´rico
na busca
Multifarmas X X X X
Drugs.com X X X X X
WebMD X X X X
CVS Pharmacy X X X X
SIDER X
Bula´rio Eletroˆnico
da ANVISA X X
Wikibula X X
iPhone Guia
dos Reme´dios X X X X
Netfarma X X X X
Memed X X X X X
BulasMed X X X X
Bula´rio X X X X X
MedicinaNET X X
Tua Sau´de X X X
Minha Vida X X X
Localdoc Bulas X X
Alergia a
Medicamentos X
Interac¸o˜es
Medicamentosas.com.br X X
MedSUS X X
47
No contexto comercial, existem va´rios aplicativos e ferramentas que auxiliam no tra-
balho do profissional da a´rea da sau´de e tambe´m na vida dos pacientes. A Tabela 1 elenca
algumas destas ferramentas relacionadas com a busca por medicamentos e possı´veis interac¸o˜es,
juntamente com reac¸o˜es adversas, presentes no mercado. Por meio da Tabela 1 apresentam-se
em nı´vel internacional as seguintes ferramentas: (i) Drugs.com4; (ii) WebMD5; (iii) CVS Phar-
macy6; e (iv) SIDER7, que permitem o usua´rio pesquisar medicamentos e verificar possı´veis
interac¸o˜es medicamentosas, reac¸o˜es adversas e contraindicac¸o˜es, pore´m elas na˜o atendem ao
pu´blico brasileiro pois na˜o apresentam informac¸o˜es sobre os medicamentos em Lı´ngua Portu-
guesa.
Ja´ em aˆmbito nacional exibem-se as ferramentas: (i) Multifarmas8; (ii) Wikibula9;
(iii) Bula´rio Eletroˆnico da ANVISA; (iv) Guia dos Reme´dios10; (v) Netfarma11; (vi) Memed12;
(vii) BulasMed13; (viii) Bula´rio14; (ix) MedicinaNET15; (x) Tua Sau´de16; (xi) Minha Vida17;
(xii) Localdoc Bulas18; (xiii) Alergia a Medicamentos19; e (xiv) MedSUS 20, na qual permitem
que os usua´rios pesquisem pelos nomes dos medicamentos, pore´m na˜o apresentam interac¸o˜es
medicamentosas, nem contraindicac¸o˜es ou reac¸o˜es adversas que esses possam ter com outros
medicamentos ou doenc¸as relacionadas por meio de cruzamento de informac¸o˜es. A ferramenta
Interac¸o˜es Medicamentosas.com.br21 apresenta uma pesquisa de interac¸o˜es entre medicamentos
com pouca usabilidade sobre a funcionalidade, ale´m de que os resultados apresentados na˜o
mostram as informac¸o˜es retiradas do trecho do arquivo da bula para que os usua´rios visualizem
com mais detalhes.
Dentre estas ferramentas destaca-se o Drugs.com que apresenta uma busca por medi-
camentos e informa possı´veis reac¸o˜es adversas com outros medicamentos, pore´m uma desvan-
tagem deste sistema e´ que na˜o atende o pu´blico brasileiro, ja´ que se trata de uma ferramenta em
4htt p : //drugs.com
5htt p : //www.webmd.com/interaction− checker
6htt ps : //www.cvs.com/drug/interaction− checker
7htt p : //sidee f f ects.embl.de
8htt p : //multi f armas.com.br
9htt p : //wikibula.com.br
10htt p : //med phone.com.br
11htt p : //net f arma.com.br
12htt p : //memed.com.br/home
13htt p : //www.bulas.med.br/
14htt p : //bulario.net/
15htt p : //www.medicinanet.com.br/
16htt p : //www.tuasaude.com/c/bulas/
17htt p : //www.minhavida.com.br/saude/bulas
18htt p : //localdoc.com.br/
19htt p : //www.imabrasil.com.br/
20htt p : //www.datasus.gov.br/
21htt p : //interacoesmedicamentosas.com.br/
48
aˆmbito internacional e na˜o contempla uma base de informac¸o˜es sobre medicamentos em Lı´ngua
Portuguesa. Nesse caso, quem pesquisasse neste website teria que traduzir o princı´pio ativo para
ingleˆs, pois os medicamentos usados em outros paı´ses tem apenas o nome comercial diferente,
mas o princı´pio ativo muitas vezes e´ o mesmo. Diferente do que apresenta o Drugs.com, o
Bula´rio Eletroˆnico da ANVISA possui informac¸o˜es sobre os medicamentos utilizados no Paı´s,
mas na˜o realiza uma pesquisa ta˜o completa e especializada como a ferramenta do Drugs.com.
3.2 FARMACOVIGILAˆNCIA
O termo Farmacovigilaˆncia define o conjunto de atividades que possuem as seguintes
finalidades: (i) identificac¸a˜o de reac¸o˜es adversas previamente desconhecidas; (ii) encontro de
riscos entre estas reac¸o˜es; (iii) administrac¸a˜o de medidas reguladoras a` respeito das reac¸o˜es
adversas; e (vi) informac¸a˜o aos profissionais de sau´de e ao pu´blico sobre estas questo˜es (LA-
PORTE; BAKSAAS; LUNDE, 1993).
Conhecer todas as reac¸o˜es adversas de um determinado medicamento e´ uma tarefa
complexa, visto a quantidade variada de circunstaˆncias que podem ocasiona´-las, tanto pela
alterac¸a˜o de substaˆncias, quanto por um determinado caso isolado de um histo´rico de paci-
ente. Entretanto, registra´-las em forma de ocorreˆncia por meio de um sistema de coleta de
dados, que resulte na organizac¸a˜o, avaliac¸a˜o e posterior divulgac¸a˜o das informac¸o˜es adquiridas
e´ de extrema relevaˆncia para a´rea de sau´de (CAPASSO et al., 2000).
No Brasil, foi criado o Sistema Nacional de Notificac¸o˜es para a Vigilaˆncia Sanita´ria
(NOTIVISA), que tem

Outros materiais