Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

Luiz Cláudio Buzeti
APLICAÇÃO DE METODOLOGIA DE DESCOBERTA
DE CONHECIMENTO EM DADOS PÚBLICOS:
EXPLORANDO OS SISTEMAS DATASUS E
ALICEWEB
MARINGÁ
2017
Luiz Cláudio Buzeti
APLICAÇÃO DE METODOLOGIA DE DESCOBERTA DE
CONHECIMENTO EM DADOS PÚBLICOS: EXPLORANDO OS
SISTEMAS DATASUS E ALICEWEB
Dissertação de Mestrado apresentado ao
PPGGCO - UNICESUMAR como pré-requisito
obrigatório à obtenção do título de Mestre em
Gestão do Conhecimento nas Organizações.
Linha de pesquisa: Organizações
Orientador: Prof.a Dra. Iara Carnevale de Almeida
Coorientador: Prof.o Dr. Marcelo Picinin Bernuci
MARINGÁ
2017
Luiz Cláudio Buzeti
APLICAÇÃO DE METODOLOGIA DE DESCOBERTA DE
CONHECIMENTO EM DADOS PÚBLICOS: EXPLORANDO OS
SISTEMAS DATASUS E ALICEWEB
Dissertação de Mestrado apresentado ao
PPGGCO - UNICESUMAR como pré-requisito
obrigatório à obtenção do título de Mestre em
Gestão do Conhecimento nas Organizações.
Trabalho aprovado. MARINGÁ, de de 2017:
Prof.a Dra. Iara Carnevale de Almeida
Orientador
Professor
Convidado 1
Professor
Convidado 2
MARINGÁ
2017
Agradecimentos
Primeiramente, agradeço à Professora Iara Carnevale de Almeida pela dedicação em me
orientar, apoiando-me nos momentos difíceis, mostrando-me em que e como este estudo poderia
ser melhorado, possibilitando que esta pesquisa pudesse se tornar realidade.
Ao Professor Marcelo Bernuci, que participou do projeto desde o início e, com sua
competência e seu conhecimento, tornou este um estudo interdisciplinar.
À Professora Rita Cristina Galarraga Berardi, minha orientadora no início do projeto,
que, com sua dedicação, foi fundamental na fase inicial deste estudo e me fez seguir em frente.
Ao Professor Flávio Bortolozzi, que sempre me atendeu com extrema atenção, sempre
mostrando os rumos que este estudo deveria seguir, ou seja, mostrando-me o caminho da luz.
Ao aluno de Medicina Antonio Augusto Cláudio Pereira, que teve papel decisivo na
análise dos dados, sempre com muita dedicação.
Aos Professores do PPGCCO, que conduziram-nos no processo de subida dos difíceis
degraus acadêmicos.
Às queridas e aos queridos colaboradores da Secretaria do Mestrado.
Aos meus amigos que estiveram ao meu lado nesta caminhada a quem, confesso, com
certeza, sentirei muita saudade de vocês.
Aos amigos da UEL, em especial ao Leonardo Mota Pinheiro (Assessor) e à Cecilia
Shigueko Koyama (Diretora).
À minha namorada, Ana Carolina Barbosa, inicialmente apenas uma amiga de turma,
mas que o destino nos fez unir, pelo seu carinho, por sua atenção, pela sua consideração e por
tudo mais que você fez por mim neste período.
Especialmente aos meus pais, Claudio e Maria, e irmãos, que são os alicerces da vida.
E, finalmente, a todos que, direta ou indiretamente, contribuíram para a realização desta
pesquisa.
so
Resumo
Observa-se que, no período de 2005 até 2014, o Brasil apresentou um déficit comercial de US$
16,074 bilhões relativos ao comércio de fármacos. Esse explícito esforço financeiro, para pro-
mover o acesso a medicamentos pela população, pode evitar morbidades e, consequentemente,
evitar internações. Apesar do Governo disponibilizar diversos dados abertos, tanto sobre
importações quanto sobre saúde, não existe sistema informático que possibilite o cruzamento
destas informações e, consequentemente, concluir se as importações de fármacos realmente
são válidas para evitar internações. Desta forma, o presente estudo objetivou explorar este
fenômeno e contribuir para a melhoria da gestão do conhecimento em saúde, aplicando o
modelo Buzeti, que permite a descoberta de conhecimento em dados públicos dos sistemas
DATASUS e ALICEWeb. Inicialmente foram estudadas as metodologias existentes que viabi-
lizassem a descoberta do conhecimento, sendo então definido o modelo Buzeti. Salienta-se
que foram escolhidos conceitos advindos do Knowledge Discovery in Database (KDD), que
permitem a extração de padrões, associações, regras, clusters e outras formas de codificação.
Na sequência foram realizadas as seguintes etapas propostas pelo modelo Buzeti: compreensão
dos sistemas ALICEWeb e DATASUS e dados, preparação e modelagem dos dados referentes
a importação de fármacos e internaçõe. O cruzamento desses dados gerou conhecimentos
relevantes para serem avaliados por especialistas da área da saúde. Finalmente, a grande
contribuição desse estudo é a compreensão do uso de uma metodologia KDD que permite a
criação de novos conhecimentos a partir de dados públicos.
Palavras-chave: Gestão do Conhecimento. Dados Públicos. Mineração de Dados.
Abstract
It can be observed that between 2005 and 2014 Brazil had presented a US$ 16,074 billion trade
deficit due to pharmaceutical trade. This clear financial effort to promote access to medicines
intended to avoid morbidity and its consequent hospitalizations. However the government
provides great access to open data about importation as well as healthy systems data, there
is no computerized system that allows us to cross these information in way to establish
that massive pharmaceutical products importation is a valid way to decrease morbidity
and hospitalizations rates. Therefore, in this present study we aim to contribute to better
healthcare of knowledge management in health, applying the Buzeti model, which allows the
discovery of knowledge in public data of the DATASUS and ALICEWeb systems. Initially, the
existing methodologies that enabled the discovery of knowledge were studied, and the Buzeti
model was defined. It should be noted that concepts derived from Knowledge Discovery in
Database (KDD) have been chosen, which allow the extraction of patterns, associations, rules,
clusters and other forms of coding. The following steps were proposed by the Buzeti model:
comprehension those systems, comprehension the open data of these systems, preparing and
modeling the data concerning drug importation and hospital morbidities / hospitalizations.
The crossing of these data generated relevant knowledge to be evaluated by health experts.
Finally the great contribution of this study is the comprehension of KDD methodology
application in producing knowledge from public databases.
Keywords: Knowledge Management. Public Data. Data Mining
Lista de ilustrações
Figura 1 – Modelo adaptado do Ciclo de Gestão do Conhecimento . . . . . . . . . . . . 20
Figura 2 – Técnicas, Ferramentas e Tecnologias da Gestão do Conhecimento . . . . . . . 22
Figura 3 – Métodos e Ferramentas adequadas para a GC . . . . . . . . . . . . . . . . . . 23
Figura 4 – Processo do KDD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Figura 5 – Termo Gestão do Conhecimento em Saúde . . . . . . . . . . . . . . . . . . . 27
Figura 6 – Organograma MS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Figura 7 – Organograma DATASUS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Figura 8 – Observado x Previsão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Figura 9 – Gráficos de Correlação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Figura 10 – Observado x Previsão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Figura 11 – Linha de tendência (em branco) . . . . . . . . . . . . . . . . . . . . . . . . . 38
Figura 12 – Séries temporais de temperatura mínima e máxima . . . . . . . . . . . . . . . 39
Figura 13 – Séries temporais com Sazonalidade . . . . . . . . . . . . . . . . . . . . . . . . 39
Figura 14 – Gráfico (a) de uma série Aditiva e Gráfico (b) de uma série Multiplicativa . . 40
Figura 15 – Gráfico (a) sem tedência definida e Gráfico (b) com tendência em queda . . . 41
Figura 16 – Modelo Buzeti para Descoberta de Conhecimento nas Bases de Dados dos
Sistemas ALICEWeb e SIH - SUS . . . . . . . . . . . . . . . . . . . . . . . . 47
Figura 17 – Problemática de Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Figura 18 – Tabela recebida do ALICEWeb, consulta por único NCM . . . . . . . . . . . 55
Figura 19 – Tabela recebida do ALICEWeb, consultapor detalhamento de NCM . . . . . 56
Figura 20 – Diagrama de Intersecção das tabelas cap2801062009 e cap2807122009 . . . . 60
Figura 21 – Formato final do Banco de Dados . . . . . . . . . . . . . . . . . . . . . . . . 62
Figura 22 – Porcentagem Gastos em Dólar por Capítulo (2009-2015) . . . . . . . . . . . . 63
Figura 23 – Comparativo de gastos em Dólar e Kg importados (2009-2015) - Capítulo 28 64
Figura 24 – Gráfico de correlação de Dólar versus Kg importados (2009-2015) do Capítulo 28 65
Figura 25 – Histograma de Distribuição de Correlações das Mercadorias do Capítulo 28 . 67
Figura 26 – Comparativo de gastos em Dólar e Kg importados (2009-2015) da Mercadoria
Hipocloritos de Sódio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
Figura 27 – Comparativo de gastos em Dólar e Kg importados (2009-2015) da Mercadoria
Molibdênio 99 absorvido em alumina apto para a obtenção de Tecnécio 99 . . 69
Figura 28 – Comparativo de gastos em Dólar e Kg importados (2009-2015) - Capítulo 29 70
Figura 29 – Histograma de Distribuição de Correlações das Mercadorias do Capítulo 29 . 71
Figura 30 – Comparativo de gastos em Dólar e Kg importados (2009-2015) - Capítulo 30 72
Figura 31 – Histograma de Distribuição de Correlações das Mercadorias do Capítulo 30 . 73
Figura 32 – Gráfico de sazonalidade das variáveis Dólar e Kg do Capítulo 28 . . . . . . . 75
Figura 33 – Gráfico de teste de melhor método - Previsões para gasto em Dólar - Capítulo 28 76
Figura 34 – Gráfico de previsão utilizando-se do modelo ARIMA para o Capítulo 28 - Dólar 77
Figura 35 – Gráfico de teste de melhor método - Previsões para gasto em Dólar - Capítulo 29 77
Figura 36 – Gráfico de previsão utilizando-se do modelo ETS(ANN) - Capítulo 29 - Dólar 78
Figura 37 – Gráfico de teste de melhor método - Previsões para gasto em Dólar - Capítulo 30 79
Figura 38 – Gráfico de previsão utilizando-se do modelo ETS para Capítulo 30 - Dólar . . 80
Figura 39 – Tela TABNET - Morbidades . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
Figura 40 – Tela TABNET - Opções Morbidades . . . . . . . . . . . . . . . . . . . . . . . 82
Figura 41 – Tela TABNET - filtro das Morbidades . . . . . . . . . . . . . . . . . . . . . . 83
Figura 42 – Cabeçalho Planilha SIH - SUS 1 . . . . . . . . . . . . . . . . . . . . . . . . . 83
Figura 43 – Cabeçalho Planilha SIH - SUS 2 . . . . . . . . . . . . . . . . . . . . . . . . . 84
Figura 44 – Planilhas de Morbidades que foram eliminadas . . . . . . . . . . . . . . . . . 84
Figura 45 – As 10 Morbidades com maior número de internações . . . . . . . . . . . . . 85
Figura 46 – 10 Morbidades com maiores gastos em reais . . . . . . . . . . . . . . . . . . . 86
Figura 47 – 10 morbidades que geram o maior número de óbitos . . . . . . . . . . . . . . 86
Figura 48 – Comparativo de Internações e Óbitos de Pneumonia(2009-06/2016) . . . . . 87
Figura 49 – Comparativo de Internações e Óbitos de Septicemia(2009-06/2016) . . . . . . 87
Figura 50 – Morbidade e Fármacos correlacionados . . . . . . . . . . . . . . . . . . . . . . 88
Lista de tabelas
Tabela 1 – Cadastros Nacionais SUS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Tabela 2 – Métodos de Suavização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
Tabela 3 – Medidas de cálculo de erro de previsão . . . . . . . . . . . . . . . . . . . . . . 37
Tabela 4 – Revisão Sistemática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Tabela 5 – Pacotes R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Tabela 6 – Desdobramentos da NCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
Tabela 7 – Composição da NCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
Tabela 8 – Capítulos abordados pelo presente estudo . . . . . . . . . . . . . . . . . . . . 53
Tabela 9 – Opções das Variáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Tabela 10 – Capítulos e suas quantidades de mercadorias . . . . . . . . . . . . . . . . . . 58
Tabela 11 – Tabela Semestrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
Tabela 12 – Tabela Anuais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Tabela 13 – Tabelas de 2009 a 2015 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Tabela 14 – Correlação do produto de momento de Pearson (Dados: Dólar vs Kg) . . . . 65
Tabela 15 – Resumo correlação do produto de momento de Pearson (Dados: Dólar vs Kg) 66
Tabela 16 – Frequência Relativa das Correlações do Capítulo 28 . . . . . . . . . . . . . . 67
Tabela 17 – Frequência Relativa das correlações do Capítulo 29 . . . . . . . . . . . . . . . 71
Tabela 18 – Frequência Relativa das Correlações do Capítulo 30 . . . . . . . . . . . . . . 73
Tabela 19 – Teste de estacionariedade Dólar . . . . . . . . . . . . . . . . . . . . . . . . . 74
Tabela 20 – Teste de estacionariedade Kg . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
Tabela 21 – Métodos de Previsão para o Capítulo 28 . . . . . . . . . . . . . . . . . . . . . 76
Tabela 22 – Métodos de Previsão para o Capítulo 29 . . . . . . . . . . . . . . . . . . . . . 78
Tabela 23 – Métodos de Previsão para o Capítulo 30 . . . . . . . . . . . . . . . . . . . . . 79
Tabela 24 – Morbidades e Fármacos relacionados . . . . . . . . . . . . . . . . . . . . . . . 101
Tabela 25 – Morbidades e Fármacos relacionados . . . . . . . . . . . . . . . . . . . . . . . 116
Tabela 26 – Correlação menor que 0.561, entre as variáveis Dólar e Kg das mercadorias do
Capítulo 28 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
Tabela 27 – Finalidade das mercadorias do Capítulo 28 com correlação menor que 0.561,
entre as variáveis Dólar e Kg . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
Tabela 28 – Correlação menor que 0.5811, entre as variáveis Dólar e Kg das mercadorias . 136
Tabela 29 – Finalidade das mercadorias que não possuem correlação significativa - Capítulo
29 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
Tabela 30 – Tabela correlação entre Dólar e Kg das mercadorias menor que 0.51 do Capítulo
30 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
Tabela 31 – Finalidade das mercadorias que não possuem correlação significativa - Capítulo
30 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
Tabela 32 – Produtos farmacêuticos utilizados na prática médica . . . . . . . . . . . . . . 147
Lista de abreviaturas e siglas
ADF Augmented Dickey-Fuller
ALICEWeb Análise das Informações de Comércio Exterior (meio WEB)
AM Aprendizado de Máquina
APO Asian Productivity Organization
BD Bancos de Dados
BH Benjamim Hochberg
BI Business Intelligence
BNDES Banco Nacional de Desenvolvimento Econômico e Social
CADSUS Cadastro de Usuário do SUS
CEPAL Comissão Econômica para a América Latina e o Caribe
CID-10 Classificação Internacional de Doenças e Problemas Relacionados à Saúde
CNES Cadastro Nacional de Estabelecimentos de Saúde
CNES Net cadastro nacional de Estabelecimento de Saúde com dados disponíveis na
Internet
CNS Conselho Nacional de Saúde
CRAN Comprehensive R Archive Network
DATASUS Departamento de Informática do SUS
DeCS Descritores em Ciências da Saúde
DECIT Departamento de Ciência e Tecnologia
DM Data Mining
EGD Estratégia do Governança Digital
ETS ExponenTial Smoothing
FMI Fundo Monetário Internacional
GC Gestão do Conhecimento
GECIS Grupo Executivo do Complexo Industrial da Saúde
GHS Sistema Harmonizado Globalmente para a Classificação e Rotulagem de Pro-
dutos Químicos
IA Inteligência Artificial
IBGE Instituto Brasileiro de Geografia e Estatística
IC Inteligência Competitiva
KDD Knowledge Discovery in Databases
Kg Quilogramas
LaTex Conjunto de macros para o programa de diagramação de textos TeX
MAE Mean absolute error
MAPE Mean absolute percentage error
MASE Mean absolute scaled error
MD Mineração de Dados
ME Meanerror
MSE Mean Squared error
MS Ministério da Saúde
NCM Nomenclatura Comum do Mercosul
OMA Organização Mundial de Aduanas
OMS Organização Mundial de Saúde
OPAS Organização Panamericana de Saúde
PD Pesquisa e Desenvolvimento
PDP Política de Desenvolvimento Produtivo
PESS Pesquisas Estratégicas para o Sistema de Saúde
PIB Produto Interno Bruto
PITCE Política Industrial Tecnológica e de Comércio Exterior
PROFARMA Programa de Apoio à Cadeia Farmacêutica
RMSE Root mean squared error
SBC Sistemas Baseados em Conhecimento
SCNES Cadastro Nacional de Estabelecimentos de Saúde - versão simplificada
SERPRO Serviço Federal de Processamento de Dados
SES Suavização Exponencial Simples
SGC Sistemas de Gestão do Conhecimento
SH Sistema Harmonizado
SIH Sistema de Informações Hospitalares
SISCOMEX Sistema Integrado de Comércio Exterior
SUS Sistema Único de Saúde
TI Tecnologia da Informação
UF Unidade Federal
US$ Dólar Americano
Lista de símbolos
β Beta
e Erro de previsão
α Alpha
Sumário
1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2 Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3 Escopo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2 Revisão da literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.1 Gestão do Conhecimento . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.1.1 Captura e Criação do Conhecimento . . . . . . . . . . . . . . . . 20
2.1.2 Técnicas, Ferramentas e Tecnologias de Apoio à Gestão do Co-
nhecimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.1.3 Knowledge Discovery in Database (KDD) . . . . . . . . . . . . . 23
2.1.4 Mineração de Dados . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2 Gestão do Conhecimento em saúde pública no Brasil . . . . . . . . . . . . 26
2.2.1 Gestão do Conhecimento no Ministério da Saúde . . . . . . . . . 27
2.2.2 Gestão da Informação em Saúde . . . . . . . . . . . . . . . . . . 30
2.3 Fundamentos Estatísticos e Métodos de previsão . . . . . . . . . . . . . . 33
2.3.1 Método ARIMA(1,1,1)(0,0,1) . . . . . . . . . . . . . . . . . . . . 33
2.3.2 Método da ETS (AAdN) . . . . . . . . . . . . . . . . . . . . . . 34
2.3.3 Correlação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3.4 Método Estatístico . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.3.5 Conjuntos de Treinamento e Teste . . . . . . . . . . . . . . . . . 36
2.3.6 Erros residuais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.3.7 Séries Temporais . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.4 Revisão Sistemática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.1 Delineamento da pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.1.1 Premissas e conceitos de Gestão do Conhecimento e tecnológicos 46
3.1.2 Modelo para solucionar o problema proposto . . . . . . . . . . . 46
3.1.3 Cruzar e analisar as informações nos dois sistemas, DATASUS e
ALICEWEB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2 Outras considerações, uso do Pacote R e Latex . . . . . . . . . . . . . . . 48
4 Análise e discussão dos resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.1 Sistema ALICEWeb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.2 Sistema DATASUS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.3 Análise e interpretação do cruzamento das informações nos sistemas DA-
TASUS e ALICEWeb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.4 Considerações Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
5 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
Apêndices 100
1 Apêndice I - Tabela com as Morbidades e seus respectivos fármacos que acusaram
correlação significativa para tempos iguais (Morbidades ocorridas em Janeiro/2009
comparando com importações ocorridas em Janeiro/2009) . . . . . . . . . . . . . 101
2 Apêndice II - Tabela com as Morbidades e seus respectivos fármacos que acu-
saram correlação significativa para tempos diferentes (Morbidades ocorridas em
Junho/2009 comparando com importações ocorridas em Janeiro/2009) . . . . . . 116
3 Apêndice III - Mercadorias com baixa correlação do Capítulo 28 . . . . . . . . . 129
4 Apêndice IV - Finalidade das Mercadorias com baixa correlação do Capítulo 28 . 131
5 Apêndice V - Mercadorias com baixa correlação do Capítulo 29 . . . . . . . . . . 132
6 Apêndice VI - Finalidade das Mercadorias com baixa correlação do Capítulo 29 . 136
7 Apêndice VII - Mercadorias com baixa correlação do Capítulo 30 . . . . . . . . . 140
8 Apêndice VIII - Finalidade das Mercadorias com baixa correlação do Capítulo 30 142
Anexos 145
1 Anexo I - Relatório de análise das correlações entre morbidades e mercadorias
(fármacos), realizada por profissionais da área da saúde . . . . . . . . . . . . . . 146
14
1 Introdução
Ao longo das mudanças econômicas mundiais, os tradicionais fatores de produção - traba-
lho, capital e terra - vêm adquirindo importância secundária. Em oposição, o fator conhecimento
torna-se, cada vez mais, o principal recurso das organizações (DRUCKER; DRUCKER, 1994).
Ou seja, o diferencial competitivo entre as organizações passa a ser o conhecimento que possuem.
A área de Gestão do Conhecimento (GC) tem como objetivo oferecer suporte às organizações
na gestão desse novo e principal ativo. Esse suporte é feito por meio de princípios, práticas e
ferramentas de GC. Nesse contexto, pode-se afirmar que a GC é utilizada no auxílio à tomada
de decisão, como ferramenta de apoio na busca contínua pela inovação e, principalmente, para
adquirir uma vantagem competitiva no mercado em que atuam (DALKIR, 2005).
Essa corrida pela inovação e a consequente incorporação do conhecimento nos produtos
gerados classificam os setores industriais em quatro níveis de intensidade tecnológica: alta, meia-
alta, meia-baixa e baixa. Uma das formas de identificar tais segmentos é por meio da análise da
média de gastos em Pesquisa e Desenvolvimento (PD) sobre o faturamento. Esse gasto é um dos
parâmetros que define a intensidade tecnológica de cada setor industrial, pois aumenta o nível de
conhecimento incorporado aos produtos (ZAWISLAK et al., 2013).
Um dos segmentos industriais classificado como sendo de alta intensidade tecnológica é
o farmacêutico. Por meio de seu contínuo esforço inovador, esse segmento gera externalidades
do conhecimento, tanto tácito como explícito. Essas externalidades, mediante a produção de
novos conhecimentos, colaboram para o desenvolvimento do país e afetam a balança comercial
com as outras nações. No caso brasileiro, a balança comercial relacionada a produtos químico-
farmacêuticos apresentou um déficit contínuo entre o Brasil e o mundo. Nos dados referentes às
transações exteriores (importação/exportação) de fármacos, observa-se que, no ano de 2005, o
Brasil importou 3,31 bilhões de dólares. Já no ano de 2011 houve um salto, e o Brasil importou 9,50
bilhões de dólares (INTERFARMA, 2012). Todos os dados de importação e exportação do Brasil
são registrados no Sistema ALICEWeb, do Ministério da Indústria e Comércio. Considerando
apenas o viés financeiro, a relação entre os gastos em medicamentos e o quanto estão adentrando
no mercado interno brasileiro merece ser analisada. Não só por esse viés é necessária a análise,
mas também pelo viés social, mais precisamente, o quanto tal esforço financeiro produz de
bem-estar social.
O bem-estar social provocado pela indústria farmacêutica está vinculado ao acesso a
medicamentos que a populaçãoda nação possui. Esse acesso pode evitar morbidades, que é a
taxa de portadores de determinada doença em uma população e, consequentemente, podendo
também evitar procedimentos de internações (SAÚDE, 2005). Ou seja, quadros clínicos, que
poderiam ser controlados ambulatoriamente, apenas com medicamentos, tornam-se casos de
internação, aumentando os gastos públicos de saúde. No Brasil, esses gastos públicos e outras
informações em saúde, como dados relativos a morbidades, medicamentos, internações e outros,
estão disponíveis para acesso na base de dados do DATASUS. A Organização Mundial de Saúde
(OMS) e a Organização Panamericana de Saúde (OPAS) consideraram, conforme documento
enviado ao MS, que o conjunto de informações sobre saúde hoje disponível no DATASUS
é um dos mais completos existentes no mundo (SUS, 2002). Apesar desse reconhecimento
15
internacional pela grande quantidade de dados brutos, os sistemas do DATASUS e do ALICEWeb
podem ser enquadrados no que Han et al.(2011) descreve como sendo "rico em dados, pobre em
conhecimento".
Os gestores de saúde precisam utilizar os dados e as informações como "recursos"para
a tomada de decisão. O grande volume de dados e informações disponíveis na área poderia se
tornar um grande aliado para os gestores. Dados e informações são convertidos em conhecimento,
ativo essencial para melhoria dos sistemas e das organizações. No entanto, mesmo com todos os
esforços e investimento em tecnologias, há ainda um longo caminho para percorrer na busca pela
excelência em gestão em saúde. Pinheiro et al. (2016) afirma que o Sistema de Informação em
Saúde "ainda não atinge todo o seu potencial, pois é usado de maneira incipiente pela gestão da
saúde para o processo decisório". Assim, o desafio em prestar serviços de saúde de qualidade à
população brasileira pode ter a GC como aliada. Todos os recursos, principalmente os de base
tecnológica, podem ser utilizados com a finalidade de melhorar o sistema de saúde pública.
A gestão eficaz do conhecimento pode ser feita por meio do uso da tecnologia da informação.
Apenas acumular os dados não significa realizar a Gestão do Conhecimento. É necessário aplicar
métodos desenvolvidos no campo da inteligência artificial. A Inteligência Artificial (IA) é um
termo geral que implica o uso de um computador para modelar o comportamento inteligente com
a mínima intervenção humana (HAMET; TREMBLAY, 2017). Muitas das técnicas de captura
de conhecimento derivam de técnicas que foram, originalmente, usadas na inteligência artificial -
mais especificamente no desenvolvimento de sistemas especializados (DALKIR, 2005). Uma das
aplicações da inteligência artificial é por meio do Knowledge Discovery in Database(KDD).
O KDD pode ser definido como um processo não trivial de identificação de padrões
a partir de dados, sendo que esses padrões devem ser potencialmente úteis e compreensíveis
(FAYYAD et al., 1996). Como um processo, o KDD possui diversas etapas e, dentre essas etapas, a
de mais importância é o Data Mining(DM). A extração do conhecimento a partir de determinada
fonte de dados é realizada na etapa do DM, ou Mineração de Dados. Nessa etapa são utilizadas
técnicas e/ou modelos estatísticos e de IA para realizar a criação do conhecimento.
Assim, devemos considerar três situações para a construção da problemática deste
estudo. A primeira situação que devemos considerar é que o maior custo para o SUS está nas
internações ambulatoriais. A segunda situação é que dentro de uma população que possui acesso
a medicamentos ocorre a diminuição de internações. A terceira situação é que o Brasil possui dois
bancos de dados públicos, com décadas de registro, sendo um o ALICEWeb e o outro o DATASUS.
O ALICEWeb com todas as importações e exportações registradas, inclusive de medicamentos,
e o DATASUS, uma das bases de dados mais ricas do mundo, onde estão registrado todos os
procedimentos, inclusive internações ocorridas nas últimas décadas. A partir dessas premissas,
foi levantado o seguinte problema de pesquisa: as importações de medicamentos influenciam as
quantidades de internações ocorridas no país?
1.1 Objetivos
O presente estudo tem por objetivo geral a criação do conhecimento, utilizando as técnicas
do KDD e tendo como fonte de dados os sistemas DATASUS e ALICEWeb. A partir da definição
16
do objetivo geral, temos os seguintes objetivos específicos:
• Definir os principais conceitos de Gestão do Conhecimento, Inteligência Artificial, KDD e
Mineração de Dados;
• Estudar a Gestão do Conhecimento na saúde pública no Brasil, mais especificamente, os
sistemas ALICEWeb e DATASUS;
• Propor um modelo de KDD para o problema de pesquisa;
• Discutir e analisar os resultados da criação de conhecimento a partir das bases de dados
utilizadas;
• Realizar previsões de importação de fármacos para meses futuros.
1.2 Justificativa
O estudo do fenômeno de importação de medicamentos e seus reflexos na saúde pública
é estratégico para o Brasil. O alto custo financeiro ao país, representado por um déficit de
2,155 bilhões em 2014, e o orçamento do SUS de R$ 118,5 bilhões, apenas em 2015 (BRASIL,
2016), já justificariam tal estudo. Além disso, a incorporação do conhecimento nos produtos
gerados e os reflexos no bem-estar social da população devem ser levados em consideração para
justificar a importância do estudo. Com números de tamanha expressão e considerando o aspecto
humanístico que envolve a saúde, há a necessidade de profissionalizar quadros técnicos e adotar
o apoio de processos eficazes, como, por exemplo, a Gestão do Conhecimento.
A GC incorporou uma série de ferramentas de base tecnológica. Uma dessas ferramentas
é a Mineração de Dados. Com décadas de registros, os dois sistemas considerados neste estudo, o
ALICEWeb e o DATASUS, possuem características, principalmente em relação ao volume de
dados, que justificam a utilização da mineração de dados para a criação de novos conhecimentos.
Esses conhecimentos podem ser gerados tanto a partir dos dados individuais de cada uma das
bases, assim como do cruzamento dessas duas bases. A partir dessa premissa, é possível criar um
modelo de KDD, específico para essas bases de dados.
1.3 Escopo
Com relação ao presente estudo, na Revisão da literatura será realizada a fundamentação
teórica de todos os conceitos que serão utilizados neste trabalho: Gestão do Conhecimento, KDD,
DM, Gestão do Conhecimento em Saúde Pública no Brasil, Fundamentos Estatísticos e Métodos
de previsão e, por fim, uma Revisão Sistemática de trabalhos relacionados ao tema em questão.
Na sequência, na Metodologia, serão apresentados o delineamento da pesquisa, a proposta de um
modelo para solucionar este problema e o uso do Pacote R e do Latex nessa solução. Após, serão
apresentadas a análise e a discussão dos resultados deste estudo, isto é, a aplicação do modelo
nos sistemas ALICEWeb e DATASUS; a análise e a interpretação do cruzamento das informações
nesses sistemas; e as considerações finais sobre este estudo. Ao final, serão apresentadas as
Conclusões finas, com indicação dos trabalhos futuros.
17
2 Revisão da literatura
A área de saúde tem como característica relevante a grande produção de dados com
considerável complexidade. Essa característica pode ser explorada de forma mais eficiente
por meio da captura e da criação do conhecimento. Salienta-se que isso permite melhorar
tanto o entendimento do ambiente de atuação como a tomada de decisão. O presente estudo
objetiva aplicar o conhecimento advindo da Gestão do Conhecimento, mais especificamente da
criação de novos conhecimentos, para contribuir com a melhora da gestão da informação em
saúde, aplicando metodologia de descoberta de conhecimento em dados públicos dos sistemas
DATASUS e ALICEWeb. Este Capítulo apresenta os fundamentos teóricos necessários para
melhor entendimento da criação de novo conhecimento.
2.1 Gestão do Conhecimento
O conceito de conhecimento é expresso pelo intercâmbio entre dados, informação e
conhecimento. Schreiber (2000) define esSes termosda seguinte forma:
• Dados são os sinais ainda não interpretados que atingem os nossos sentidos;
• Informações são os dados equipados com algum significado;
• Conhecimento é todo o corpo de dados e informações que as pessoas trazem para suportar
a utilização prática em ação, a fim de realizar as tarefas e criar novas informações;
A composição entre dados e informações gera o conhecimento. Atualmente, segundo Paton
et al. (2015), a informação e o conhecimento são as armas mais competitivas para as empresas.
Sendo assim, o acúmulo do conhecimento de qualidade proporciona um diferencial competitivo
dentro do mercado em que atuam. Pode-se ainda dizer que o conhecimento fomenta e alavanca a
inovação, que é o processo de reinvenção do negócio ou dos produtos. O conhecimento pode ser
criado, compartilhado e aplicado por meio de pesquisas, insights, observações, repositórios, troca
de experiências e outros, que compõem o arcabouço do registro e o aprendizado organizacional.
O conhecimento presente nas organizações, pode ser classificado de duas maneiras:
• Tácito: é o conhecimento pessoal, intrínseco, o know-how, difícil de articular e também
difícil de colocar em palavras, em texto ou em desenhos. Segundo Dhanaraj et al. (2004),
o conhecimento tácito é definido como o conhecimento não verbalizável, intuitivo e não
articulável. Outra definição de conhecimento tácito é o "que existe na mente das pessoas e,
além de ser peculiar, cada indivíduo tem o seu modelo mental distinto, pois as experiências
são diferenciadas"(COSTA, 2009, pg. 29).
• Explícito: como o próprio nome evidencia, é o conhecimento codificado, estruturado e
representa o conteúdo que foi capturado em alguma forma tangível, como palavras, gravações
de áudio, imagens e outros (DALKIR, 2005).
Portanto, o conhecimento tornou-se um dos maiores, se não o maior, ativos de uma
organização. E, como qualquer ativo, as empresas precisam de estratégias, políticas e ferramentas
18
para gerenciá-lo. A Gestão do Conhecimento (GC) tem como objetivo auxiliar as organizações
no trato desse ativo. Uma das definições propostas para GC é:
A Gestão do Conhecimento é a coordenação deliberada e sistemática das
pessoas, tecnologia, processos e estrutura organizacional para agregar valor através
da reutilização e inovação. Esta coordenação é conseguida através da criação, com-
partilhamento e aplicação do conhecimento, bem como através da alimentação das
valiosas lições aprendidas e as melhores práticas para a memória corporativa, a fim de
promover a aprendizagem organizacional continuada (DALKIR, 2005, pg. 3).
A GC também é definida por Gray (1996) como uma abordagem colaborativa e inte-
grada para a criação, a captura, a organização, o acesso e o uso dos bens intelectuais de uma
empresa. Takeuchi e Nonaka (2009) definem a GC como criação de conhecimento, em que o
conhecimento individual é traduzido e transformado em conhecimento organizacional, gerando
vantagem competitiva. Para Mcinerney (2002, p. 1008), a "Gestão do Conhecimento é um
esforço para aumentar o conhecimento útil dentro da organização. Através do encorajamento
da comunicação, oferecendo oportunidades para aprender e promover o compartilhamento de
artefatos de conhecimento apropriados".
Conforme Baskerville e Dulipovici (2006), a Gestão do Conhecimento é multidisciplinar e
está construída sobre fundamentos teóricos de economia da informação, gestão estratégica, gestão
por competência, cultura organizacional, comportamento organizacional, estrutura organizacional,
inteligência artificial, gestão da qualidade, medição de desempenho organizacional, entre outros.
Portanto, pode-se dizer que a Gestão do Conhecimento possui uma abordagem holística, com
uma visão ampla e sistêmica da organização, o que significa ter, em uma única imagem, todos os
elementos que formam a estrutura organizacional.
Com tamanha importância para o mundo dos negócios, a necessidade de gerir o conhe-
cimento é óbvia e de característica complexa. Observa-se a complexidade da GC a partir dos
ciclos que a formam, os quais são a captura (criar e recuperar), o compartilhamento (disseminar)
e a aplicação (utilizar) do conhecimento na organização (DAVILA et al., 2014). Tais ciclos, se
devidamente implantados e maturados dentro de uma organização, fomentam a excelência no
negócio, haja vista que o conhecimento registrado e compartilhado resulta na diminuição de erros
cometidos, colabora com a eficiência, com a produtividade e com o processo de inovação.
Na literatura, são descritos diversos ciclos para a Gestão do Conhecimento (GC), os mais
conhecidos são os ciclos de Meyer e Zack (1996), de Bukowitz e Williams (2000), de McElroy
(2003), e de Wiig (1993). Com base nesses ciclos, Dalkir (2005) concebe um ciclo da GC integrado,
representado na Figura 1.
Observa-se que o conteúdo do conhecimento é avaliado entre as fases de "Captura e
criação do conhecimento" e "Compartilhamento e disseminação do conhecimento". Na sequência,
o conhecimento é então contextualizado, a fim de ser entendido (aquisição) e utilizado (aplicação).
Em seguida, é realimentado o primeiro ciclo, por meio da "Captura e criação do conhecimento",
a fim de atualizar os conhecimentos captados. Essas fases, então são, responsáveis por:
19
Figura 1 – Modelo adaptado do Ciclo de Gestão do Conhecimento
Fonte: (DALKIR, 2005)
• Captura e Criação: identificação e codificação de conhecimento interno da organização e/ou
conhecimento a partir de ambiente externo;
• Compartilhamento e Disseminação: realizar a contextualização de conteúdo. Fazer a junção
entre o conhecimento e as pessoas;
• Aquisição e Aplicação: após a avaliação do conhecimento e tendo sido considerado como
importante, é armazenado nas práticas da organização.
Este estudo foca na primeira fase, isto é, captura e criação do conhecimento nas organiza-
ções, utilizando ferramentas tecnológicas que permitam trabalhar com grandes volumes de dados.
É importante salientar que GC não é apenas sobre tecnologia, mas sim uma série de atividades
complexas, e é formada por um conjunto de bases, tais como: tecnologia, processos e pessoas, as
quais dão a sustentação para o desenvolvimento da GC (SERVIN; BRUN, 2005). No entanto,
em função da captura e da criação do conhecimento estarem ligadas à inovação e a melhoria na
competitividade, é importante o desenvolvimento de seus aspectos.
2.1.1 Captura e Criação do Conhecimento
Conforme Nonaka (1994), a criação de conhecimento envolve o desenvolvimento de novos
conhecimentos ou a substituição dos conhecimentos existentes por novos conteúdos. Já Dalkir
(2005) considerada a captura e a criação do conhecimento como a primeira fase do ciclo da GC.
Conforme Figura 1, a criação do conhecimento é o processo pelo qual o conhecimento tácito é
capturado ou provocado, e o conhecimento explícito é organizado ou codificado.
A captura refere-se à identificação e à subsequente codificação do conhecimento interno
existente (normalmente inédito) dentro da organização e/ou a um conhecimento de origem
externa ao ambiente. Já a criação de conhecimento é o desenvolvimento de novos conhecimentos
e know-how (inovações que não tinham uma existência prévia dentro da empresa) (DALKIR,
2005).
20
Há muitas maneiras de criar novos conhecimentos. No nível individual, o conhecimento
é criado por meio das atividades do aprender fazendo, da resolução de problemas em comum
ou de brainstorming das atividades realizadas. No departamento ou no nível organizacional,
por meio dos processos de inovação dentro dos departamentos de Pesquisa e Desenvolvimento
ou mediante a compra ou fusão com outras empresas (NAIR et al., 2009). Obviamente, não é
qualquer conhecimento que é útil para a organização.
O novo conhecimento deve agregar valor ao negócio, colaborando com a aprendizagem
organizacional, reduzir custos e poder utilizá-lo no processo decisório. A utilidade do novo
conhecimento pode ainda ter diversos interessados. Pode ser útil para o indivíduo, apenas para
um setor ou para a organizaçãocomo um todo. Pode ainda ser útil para todo um sistema
complexo como, por exemplo, o sistema de saúde de um país de dimensões continentais e cujo
acesso à saúde é um direito de milhões de cidadãos, como é o caso do Brasil. A utilidade é
reconhecida por tornar o conhecimento um recurso para o planejamento de ações inteligentes e
eficazes para os interessados (MOYA et al., 2009).
A criação do conhecimento pode ser ainda a partir de um pequeno volume de dados e ser
também de grande utilidade. O Staff da seleção brasileira olímpica de futebol analisou os possíveis
batedores de pênalti da Alemanha prevendo uma eventual disputa na final das Olimpíadas 2016.
Um dos analisados foi o jogador Petersen. Dispunham de 8 penalidades convertidas pelo jogador,
ou seja, dispunham de 8 variáveis. Constataram que dos oito pênaltis analisados, o jogador
converteu quatro no canto esquerdo e os outros quatro no canto direito, o que, a princípio, não
trouxe nenhuma vantagem competitiva. No entanto, em uma análise mais detalhada, viram
que, quando o jogo era de maior importância, ele batia forte do canto esquerdo, e quando o
jogo era de menor importância, mudava de lado (BRUM, 2016). A partir de uma análise de um
conhecimento explícito (vídeos), extraíram um conhecimento implícito (canto) e o conhecimento
foi compartilhado com o goleiro brasileiro, tornando tácito. Tal criação do conhecimento foi, se
não o principal, o último capítulo para a conquista da inédita medalha de ouro olímpica para o
futebol. Apesar de existir a criação de novos conhecimentos a partir de pequenas bases de dados,
esta é uma exceção. Vivemos em um era digital, na qual o volume de dados é imenso, crescente e
de difícil análise.
Considerando esse grande volume de dados e informações que são produzidos pelas
organizações, a criação, o compartilhamento e a disseminação do conhecimento tornam-se
impossíveis sem o auxílio de ferramentas tecnológicas. Para a extração do conhecimento, é
necessária a identificação dos repositórios organizacionais e das habilidades inerentes a cada
um (DEMARCHI et al., 2011). Assim, para dar suporte à criação do conhecimento, surgem as
técnicas, ferramentas e tecnologias de apoio à GC.
2.1.2 Técnicas, Ferramentas e Tecnologias de Apoio à Gestão do Conhecimento
Os repositórios com informações não estruturadas, como as redes sociais ou asWiki’s, são
formados por textos e, consequentemente, não são construídos de uma forma idêntica, sequencial
e separada. Por outro lado, os repositórios com conteúdos estruturados, representados pelos
bancos de dados, são formados por uma estrutura organizada, sequencial e de menor dificuldade
21
para manipulá-los.
O registro computacional de dados está ocorrendo há décadas e, justamente esses re-
gistros, formam os bancos de dados (BD). Esse produto da informação tornou-se um ativo
estratégico para as organizações, que necessitam desse registro para o conhecimento, para a
organização e para a administração do negócio. Os BD, inicialmente, são utilizados para acessar
conhecimentos dedutivos. No entanto, com o desenvolvimento de ferramentas computacionais,
criou-se a possibilidade de se ter acesso não apenas a esses conhecimentos explícitos, mas também
a conhecimentos implícitos, que estão ocultos nessa imensidão de dados. Nesse contexto, surge o
KDD e sua etapa de Mineração de dados (Data Mining). Segundo Dalkir (2005), as principais
ferramentas, técnicas e tecnologias de GC em uso atualmente são exibidas na Figura 2:
Figura 2 – Técnicas, Ferramentas e Tecnologias da Gestão do Conhecimento
Fonte: (DALKIR, 2005)
O processo de Gestão do Conhecimento contempla toda a forma de geração, armazena-
mento, distribuição e utilização do conhecimento. Segundo Dalkir (2005), muitas ferramentas e
técnicas são "emprestadas" de outras disciplinas, e outras são específicas para a GC. Conforme a
Figura 2, observa-se que as Técnicas, as Ferramentas e as Tecnologias são separadas por fases
da GC. O Data Mining é destacado na fase de criação e captura do conhecimento. Uma outra
observação que deve ser destacada é que a Inteligência Artificial, que consta na fase de aquisição
e aplicação do conhecimento, está também ligada em vários processos do Data Mining.
Ainda destacando o Data Mining na GC, a Asian Productivity Organization (APO)
(NAIR et al., 2009) organizou um guia simples e abrangente, no qual aborda todos os elementos
relevantes de uma solução para a Gestão do Conhecimento. Esse guia serve como referência para
22
todos os tipos de organização que têm como objetivo melhorar seu desempenho utilizando-se da
GC. Nesse guia, são citadas muitas tecnologias de GC, que continuam a surgir rapidamente, tais
como apresentetadas na Figura 3:
Figura 3 – Métodos e Ferramentas adequadas para a GC
Fonte: (NAIR et al., 2009) - APO
Especificamente no processo de criação do conhecimento é citada a ferramenta do Data
Mining, corroborando com Dalkir (2005). No âmbito da gestão pública brasileira, Batista (2012),
por meio do livro "Modelo de Gestão do Conhecimento para a Administração Pública Brasileira",
cita o Data mining como "ferramenta de TI para apoio à GC - os mineradores de dados são
instrumentos com alta capacidade de associação de termos, permitindo-lhes "garimpar"assuntos
ou temas específicos".
A utilização eficiente de ferramentas e de técnicas computacionais para lidar com conheci-
mento é essencial e, conforme a Figura 2 e a Figura 3, está presente em todos os ciclos da GC. Isso
evidencia que administrar o conhecimento significa, inicialmente, armazenar esse capital. Esse
armazenamento, em tempos atuais, requer disponibilizá-los em repositórios de dados, informações
e conhecimentos. Liebowitz e Beckman (1998) definem repositório como um armazém baseado
em computador on-line de especialização, conhecimento, experiências e documentação sobre um
determinado domínio de especialização.
2.1.3 Knowledge Discovery in Database (KDD)
A partir da necessidade de análise, de maneira não tradicional, de grandes quantidades
de dados, surge o conceito do Knowledge Discovery in Databases (KDD). O KDD pode ser
compreendido como um processo com o objetivo de descobrir padrões, grupos, falhas, tendências
23
e/ou outros conhecimentos relevantes, por meio da análise de grandes conjuntos de dados, tendo
como principal etapa a Mineração de Dados (FAYYAD et al., 1996). Segundo Tuomi (1999)
o caminho para o conhecimento é hierárquico, vendo os dados como um pré-requisito para a
informação e a informação como pré-requisito para o conhecimento. Assim, a saúde pública
brasileira é um campo que oferece grandes possibilidades de aplicação do conceito do KDD, haja
vista a grande quantidade de dados que são produzidos em todo o território nacional. Esses dados
necessitam de Sistemas Baseados em Conhecimento (SBC) para sua análise e transformação
em conhecimento. Wu e Wang (2006) comentam que grande parte dos investimentos em GC é
voltada aos Sistemas de Gestão do Conhecimento (SGC), ferramentas baseadas na Tecnologia
da Informação (TI) capazes de suportar os processos da GC, que contemplam a criação do
conhecimento.
O KDD é constituído de três principais fases: pré-processamento, mineração de dados e
pós-processamento (interpretação/avaliação) (REZENDE, 2003). A Figura 4 ilustra o fluxo do
processo do KDD:
Figura 4 – Processo do KDD
Fonte: (FAYYAD et al., 1996)
Conforme a Figura 4, o KDD é um processo interativo que é utilizado, basicamente,
para transformar dados brutos em conhecimento útil (GOEBEL; GRUENWALD, 1999). A
mineração de dados é um dos passos mais importantes do processo de descoberta de conhecimento
em bases de dados e é considerada como subcampo significativo na gestão do conhecimento
(SILWATTANANUSARN; TUAMSUK, 2012). No entanto, há outras fases que também fazem
parte do KDD, conforme segue.
I Seleção de dados
A seleção dos dados é a primeira etapa no processo de KDD. Nessa fase é escolhido o
conjunto de dados, com suas variáveis, atributos e registros. As fontes para a seleção podem vir
24em diferentes formatos, como data warehouses, planilhas e sistemas.
II Pré-processamento e limpeza
O Pré-processamento e a limpeza dos dados trabalham com a qualidade dos dados,
eliminando os dados redundantes, inconsistentes, recuperando dados incompletos e avaliando
dados discrepantes (outliers).
III Transformação dos dados
Para que as rotinas e os algoritmos possam ser aplicados, os dados, após terem passado
pelas fases anteriores, necessitam ser armazenados e formatados corretamente. A transformação
pode ocorrer na forma de planilhas para banco de dados, ou mesmo banco de dados para séries
temporais. Problemas com formatação de moedas e datas locais também aparecem nesta fase.
IV Mineração de dados
Por se tratar da fase de maior importância, há uma seção específica para abordar a
Mineração, a qual está disponível na seção 2.1.4.
V Interpretação e avaliação
Nesta fase, há a necessidade da participação de um especialista no assunto em questão.
A participação do especialista será na interpretação e na avaliação do conhecimento produzido.
Caso o resultado não seja satisfatório o processo pode retornar a qualquer um dos estágios
anteriores ou ser recomeçado (PRASS, 2007), conforme pode ser observado na Figura 4.
Especificamente neste estudo, focar-se-á em uma das fases do KDD, que também é
considerada uma ferramenta da Gestão do Conhecimento, a Mineração de dados ou Data Mining,
conforme seção a seguir.
2.1.4 Mineração de Dados
Considerada a principal fase do KDD, a Mineração de Dados (MD) é a etapa em que
ocorre a descoberta de novos conhecimentos em base de dados de grande volume. A MD infere e
estuda dados em estruturas complexas. O resultado dessa aferição e desse estudo é a descoberta
de novos conhecimentos, de caráter não trivial e indutivo. As principais técnicas da MD são:
análise de cluster, árvores de decisão, redes neurais, indução de regras, algoritmos genéticos e
aprendizado baseado em casos (LEMOS et al., 2005).
Nas técnicas da MD, são utilizados conceitos de estatística, inteligência artificial e
Aprendizado de Máquina (AM). De acordo com Feigenbaum (BARR, 1981 apud FERNANDES,
2005), Inteligência Artificial é a parte da ciência da computação voltada para o desenvolvimento
de sistemas de computadores inteligentes, os quais se relacionam com a inteligência do homem.
Já o Aprendizado de Máquina, segundo Michalski et al. (2013), é um programa que aprende e que
melhora seu desempenho como consequência da experiência em uma determinada prática. Mais
especificamente, o AM é uma subdivisão da Inteligência Artificial (SILVA; VANDERLINDE,
25
2012). Na área da saúde, com grandes volumes de dados sendo armazenados, por meio da
iniciativa privada e de unidades públicas, o AM pode ter diversas aplicações. Duas dessas podem
ser na análise de prontuários eletrônicos para emissão de alertas de epidemias e na elaboração de
scores para riscos de saúde. O AM difere dos métodos estatísticos tradicionais principalmente
em função dos conceitos de intervalos de confiança e erros padrões. O foco maior da AM é
a praticidade, encontrar o que funciona, sem se preocupar com as características formais dos
modelos estatísticos. Na elaboração de um modelo de AM que funcione bem para uma amostra
X, é importante também aplicá-lo para uma amostra Y. O objetivo é verificar se está ajustado
para o novo conjunto de dados. Essa é uma das maneiras para aferir a qualidade de um modelo
de AM (CHIAVEGATTO, 2016).
Essa possibilidade de funcionar muito bem para uma amostra e não acontecer o mesmo
para uma outra caracteriza uma das limitações da AM. Esse problema é conhecido como
tendência de sobreajuste. Outra possível limitação do uso do AM é a possibilidade de acentuar
as desigualdades. Tal fato decorre da possibilidade de existirem algoritmos tendenciosos.
Na etapa de MD, as associações espúrias são objetos de preocupação. Essas associações
possuem resultados estatisticamente significantes, mas não têm sentido causal. O problema de
fazer associações de um grande número de variáveis é que, inevitavelmente, aparecem associações
espúrias. Estas são associações que apresentam significância, mas que não fazem sentido, ou seja,
é uma questão puramente de coincidência. Portanto, associação não é causalidade e por isso a
necessidade de utilizar-se de metodologias causais, como: Regressão descontínua, Diferenças em
diferenças, Propensy score, Variáveis instrumentais, Randomização medeliana.
Uma outra alternativa é a análise do nível de significância. O nível de significância
aceitável na estatística, para um único teste de hipótese, é de 5%. No entanto, quando são
realizados centenas de testes, o ideal é ajustar o nível de significância pelo número total de testes.
Isso é justificado pelo fato de se ter uma alta probabilidade de rejeitar incorretamente uma
hipótese nula (CHIAVEGATTO, 2016). Uma solução para essa questão é utilizar a taxa de falsas
descobertas, que é a cota esperada de testes considerados significantes em que a hipótese nula é
verdadeira. O objetivo é manter uma proporção de hipóteses nulas verdadeiras, consideradas
estatisticamente significantes, abaixo de um limiar. Como solução, é necessário ranquear os
p-valores e encontrar o limiar por meio do procedimento de Benjamim Hochberg (BH).
Outra forma de extrair conhecimento dentro de base de dados mediante a identificação
de padrões semelhantes, ou grupos, ou clusters. O objetivo do agrupamento é colocar os registros
em grupos, de tal forma que os registros de um grupo sejam similares aos demais do mesmo
grupo e diferentes daqueles dos demais grupos (ELMASRI et al., 2005, p. 651). A utilização de
clusters é estratégica para definir a forma de atuação para cada grupo descoberto, seja qual for a
área envolvida.
2.2 Gestão do Conhecimento em saúde pública no Brasil
A Gestão do Conhecimento possui diversas definições e entendimentos, podendo ser
implementada nas mais diversas áreas. Na área da saúde, de acordo com os Descritores em
Ciências da Saúde (DeCS) (SAÚDE, 2017a), o termo "Gestão do Conhecimento" possui a seguinte
26
definição:
Figura 5 – Termo Gestão do Conhecimento em Saúde
Fonte: DeCS
Como observado na Figura 5, a sucinta definição do termo "Gestão do Conhecimento"
na saúde nos leva ao conhecimento tácito, por meio da expressão "sabedoria coletiva", cujo
aproveitamento está ligado à capacidade de resposta e inovação. Possui ainda vínculos com as
áreas de economia, estatística e dados numéricos.
É evidente a importância da GC que, corretamente implantada, produz vantagem compe-
titiva, vantagem esta que se explicita, por exemplo, por meio da inovação e da produtividade. Na
área da saúde, a GC gera também os benefícios abordados anteriormente, mas com um diferencial
de importância: contribui para a saúde e, consequentemente, para com a vida do indivíduo. Essa
contribuição, como produto final, de viés humanístico, coloca a GC aplicada à saúde como um
campo prioritário na pesquisa científica e de atenção relevante no campo administrativo público.
Por meio de estruturas administrativas, estruturas virtuais, conferências, congressos e outros, a
GC na saúde se desenvolve e está se tornando política de estado. O Ministério da Saúde no Brasil
utiliza-se da GC em saúde, assim como a Organização Pan-Americana da Saúde e a Organização
Mundial da Saúde, que são as instituições que alavancam a GC em saúde no mundo.
2.2.1 Gestão do Conhecimento no Ministério da Saúde
O Ministério da Saúde (MS) possui o maior orçamento anual dentre os ministérios
brasileiros, sendo que, em 2016, foi de R$ 118, 5 bilhões. Com a função de oferecer condições
para a promoção, a proteção e a recuperação da saúde da população do Brasil, necessita explorar
27
todos os recursos para tornar mais eficiente sua gestão. Dentre esses recursos, está a Gestão
do Conhecimento. A discussão sobre GC em saúde pode ser feita a partir da descrição da
Missão (SAÚDE, 2017b) que o Ministério da Saúde brasileiro adota: "Promover a saúde da
população mediante a integração e a construçãode parcerias com os órgãos federais, as unidades
da Federação, os municípios, a iniciativa privada e a sociedade, contribuindo para a melhoria da
qualidade de vida e para o exercício da cidadania".
Para cumprir tal missão, o Ministério da Saúde possui oito assuntos de competência, dos
quais destacamos: i) Informações de saúde e ii) Pesquisa científica e tecnológica na área de saúde.
A partir dessas competências, analisamos a estrutura administrativa do Ministério, conforme
organograma continda na Figura 6 (página 28):
Figura 6 – Organograma MS
Fonte: Ministério da Saúde
Observando a missão e interpretando o organograma apresentado na Figura 6, o termo
"Gestão do Conhecimento" ainda não aparece registrado. No entanto, no organograma, consta
a Secretaria de Ciência, Tecnologia e Insumos Estratégicos que possui em sua hierarquia o
Departamento de Ciência e Tecnologia (DECIT) (indicado pela seta). Acessando o site do DECIT
(DECIT, 2017), surgem as primeiras referências à GC, através da descrição da função do DECIT:
O Departamento de Ciência e Tecnologia (Decit/SCTIE/MS) coordena a
formulação, implementação e avaliação da Política Nacional de Ciência, Tecnologia e
Inovação em Saúde (PNCTIS), da Agenda Nacional de Prioridades de Pesquisa em
28
Saúde (ANPPS) e das Pesquisas Estratégicas para o Sistema de Saúde (PESS). Propõe
a execução das ações no campo da Pesquisa e Desenvolvimento em Saúde. Atua no
processo de gestão do conhecimento em Ciência e Tecnologia em Saúde visando à
utilização do conhecimento científico e tecnológico em todos os níveis de gestão do
SUS...
Além de constar na descrição da função do DECIT, consultando as competências de todos
os órgãos que compõem a estrutura do Ministério da Saúde, o termo "Gestão do Conhecimento"
também aparece oficialmente, por meio do Decreto no 8901, de 10 de novembro de 2016. O Art.
No 34, do Decreto, descreve as competências do Departamento de Ciência e Tecnologia (DECIT)
e, corroborando com a função descrita anteriormente, atribui no seu inciso IV: "coordenar o
processo de gestão do conhecimento em Ciência e Tecnologia em Saúde visando à utilização do
conhecimento científico e tecnológico em todos os níveis de gestão do SUS."
No Anexo II do mesmo Decreto, ainda na estrutura do DECIT, consta a função de
"Coordenação-Geral de Gestão do Conhecimento em Ciência e Tecnologia", cuja responsabilidade
é "Promover a sistematização e o acesso às informações e evidências científicas, e disponibiliza a
formuladores de políticas públicas, gestores, equipes de saúde e sociedade". Esta Coordenação
possui uma Função Gratificada no valor de R$ 579,84 (DECRETO, 2017).
Apesar de constar formalmente na estrutura, o termo "Gestão do conhecimento" não é
citado no site do DECIT. Não há referência direta às ações que promovam a GC no âmbito do
MS. No site consta apenas o link "Destaques Decit" com opções. Apesar dos conteúdos dessas
opções serem amplos, também não há referência a GC diretamente. Indiretamente, tais ações
visam à promoção, ao desenvolvimento e à criação do conhecimento em saúde.
No entanto, apenas evidências não atestam a utilização da GC como ferramenta de
apoio para o MS. Batista (2015) realiza um estudo, em 2014, em 81 organizações do Executivo,
incluindo o MS, com o intuito de avaliar o grau de externalização e formalização da GC na
administração pública. As organizações foram divididas em três grupos, conforme abaixo:
• Grupo 1: organizações que estão no estágio inicial ou contam com iniciativas muito
incipientes ou não têm iniciativas ainda.
• Grupo 2: organizações que estão no estágio intermediário - ou seja, mostraram nível razoável
de comprometimento estratégico com a GC e apresentaram iniciativas de curto prazo sendo
implementadas.
• Grupo 3: instituições que estão no estágio avançado - a gestão do conhecimento faz parte
das prioridades estratégicas da organização. A alta e a média administração veem o tema
com importância e os demais colaboradores compartilham parcialmente essa visão. Além
disso, as iniciativas de GC estão sendo implementadas de diversas formas.
O Ministério da Saúde foi classificado no segundo grupo, ou seja, de média maturidade
em GC. É importante citar que essa mesma avaliação já havia sido feita em 2004. Assim foi
29
possível realizar um comparativo da situação da GC nas instituições participantes, confrontando
o cenário de 2004 com o de 2014, dez anos após a primeira avaliação.
Em 2004, seis instituições encontravam-se no estágio intermediário na GC, constituído
por um grupo de instituições "que mostravam nível razoável de comprometimento estratégico com
a GC e apresentavam iniciativas de curto prazo sendo implementadas". Dentre as seis instituições
que compunham tal grupo, uma era o Ministério da Saúde. Portanto, não houve evolução, nos
últimos 10 anos, no tema Gestão do Conhecimento no MS, mesmo este tendo papel oficial na
estrutura e nos objetivos do Ministério.
2.2.2 Gestão da Informação em Saúde
Os dados, as informações e o conhecimento são os alicerces para o fazer organizacional.
Este fazer pode ser definido como qualquer ação que promova a eficiência, que melhore a execução
de tarefas e que fomente a inovação nas mais diversas áreas de atuação de uma organização. Várias
áreas do conhecimento desenvolvem modelos, métodos, técnicas, instrumentos e ferramentas
que melhorem esses fazeres, com o objetivo final de propiciar a permanência da organização no
mercado em que atuam (VALENTIM, 2014).
Essa permanência aplica-se não somente em organizações que possuem concorrência
no mercado em que atuam, mas também em organizações que, apesar de não possuírem uma
concorrência explícita, não deixam de ter a necessidade de uma atuação criativa e desafiadora em
sua área. A permanência pode ser medida pela aprovação da população que se utiliza dos seus
serviços. É o caso do Ministério da Saúde, cuja gestão de uma estrutura de tamanha complexidade
precisa ter os dados e as informações como uma das suas fontes na busca pela excelência. As
informações no âmbito da saúde pública brasileira caracterizam-se pela complexidade, dado
o grande volume de dados produzidos e, ainda, pela forma do acesso ao seu conteúdo. Tais
informações públicas de saúde, que estão presentes nas esferas municipais, estaduais e federal,
tiveram seu acesso regulamentado por meio da Lei No 12.527/2011. Esta lei regulamenta o direito
constitucional de acesso às informações públicas. Entrou em vigor em 16 de maio de 2012 e
criou mecanismos que possibilitam, a qualquer pessoa, seja física ou jurídica, sem a necessidade
de justificar o motivo, o recebimento de informações dos três Poderes:União, Estados, Distrito
Federal e Municípios, inclusive aos Tribunais de Conta e Ministério Público. Conforme o site de
acesso à informação do Governo Federal (FEDERAL, 2017), destacam-se os seguintes princípios
da lei:
• Acesso é a regra, o sigilo, a exceção (divulgação máxima).
• Requerente não precisa dizer por que e para que deseja a informação (não exigência de
motivação).
• Hipóteses de sigilo são limitadas e legalmente estabelecidas (limitação de exceções).
• Fornecimento gratuito de informação, salvo custo de reprodução (gratuidade da informação).
• Divulgação proativa de informações de interesse coletivo e geral (transparência ativa).
30
• Criação de procedimentos e prazos que facilitam o acesso à informação (transparência
passiva).
Apesar de ficar evidente que o princípio da publicidade das informações é a prioridade, a
Lei preocupou-se também com a questão do sigilo, que aplica-se aos dados pessoais, às informações
classificadas por autoridades como sigilosas e às informações sigilosas com base em outras leis.
Os dados pessoais que podem ser usados em pesquisa em saúde têm regulamentação nacional
por meio da Resolução CNS No 196, de 10 de outubro de 1996, que ratifica a confidencialidade
dos dados pessoais e, excepcionalmente, autoriza o acesso sem o consentimento dos indivíduos,
após análise por meio de um comitê de ética em pesquisa.Para provimento do acesso à essas bases de informações em saúde e outros, foi criado o
Departamento de Informática do SUS (DATASUS), em 16/04/1991, por meio do decreto No 100.
Iniciam-se suas atividades norteado pelo conceito de Downsizing, que é a redução do porte dos
equipamentos de informática utilizados para o processamento de informações (LIMA et al., 2015).
Talvez tal estratégia tenha sido um dos fatores para que o Brasil tenha uma grande base de dados
pública e de fácil acesso para pesquisas. Atualmente, os sistemas do DATASUS são considerados
pela Organização Mundial da Saúde (OMS) e Organização Pan-Americana de Saúde (OPAS),
um dos mais completos do mundo (LIMA et al., 2015).
A partir de 2011, o DATASUS passa a integrar a Secretaria de Gestão Estratégica e
Participativa, vide Figura 6, através do Decreto No 7530, de 21 de julho de 2011. A composição
da estrutura hierárquica do DATASUS pode ser visualizada na Figura 7:
Figura 7 – Organograma DATASUS
Fonte: DATASUS
Analisando a estrutura hierárquica e as atribuições das Coordenações do DATASUS,
observa-se que toda estrutura é voltada para a Gestão da Informação. Conforme Diretrizes do
DATASUS (DATASUS, 2017c), suas atribuições visam à "manutenção e correto funcionamento
da estrutura atual, a avaliação dos projetos existentes e novos, gerir a infraestrutura de tecnologia
de informação e ainda implementar políticas para a disseminação da informação em saúde".
A disseminação tem como base os Cadastros Nacionais, cuja descrição (DATASUS, 2017a) é
feita pelo site do DATASUS como "...uma série de aplicações voltadas para o cadastramento de
informações utilizadas por todos os programas criados para operacionalizar o atendimento de
saúde realizado pelo SUS". Os cadastros são descritos na Tabela 1:
31
Cadastro Descrição
CADSUS Cadastro de usuário do SUS. Permite a criação de banco de dados
para avaliação, diagnóstico, programação de ações em saúde
CID 10 Classificação Internacional de Doenças, 10ł. versão, da Organiza-
ção Mundial de Saúde. Foi disponibilizada para o meio eletrônico
disponibilizando a classificação de doenças a fim de realizar proce-
dimentos de saúde
CNES Cadastro nacional dos estabelecimentos de saúde. Cadastra e/ou
coleta: os dados físicos do estabelecimento: endereço, profissionais
e serviços vinculados ao estabelecimento e serviços de apoio ao
estabelecimento
Repositório Permite o gerenciamento unificado de tabelas utilizadas pelo SUS.
Notifica as atualizações das tabelas e mantém seu histórico. Permite
a consulta e recebimento de tabelas corporativas, nos formatos
mais utilizados (XML, DBF, CSV, CNV)
Unidades Territoriais Software com as bases territoriais onde a menor unidade é o mu-
nicípio, sendo específico para cada localidade e de uso das SES e
SMS
SCNES É o cadastro nacional de estabelecimentos de saúde em uma ver-
são simplificada, que facilita o uso em estabelecimentos de porte
pequeno
CNES Net É o cadastro nacional de estabelecimento de saúde com dados
disponíveis na Internet
Tabela 1 – Cadastros Nacionais SUS
Fonte: Site SUS
A partir desses cadastros, é possível obter e analisar os dados disponibilizados pelo DATASUS.
Essa análise pode ser feita pelos seguintes tabuladores: TABDOS (versão para DOS), TABWIN
(versão para Windows) e TABNET (versão para a Internet) (DATASUS, 2017d). Esses tabuladores
permitem selecionar e organizar os dados, assim como estabelecer associação entre tabulações a
mapas, permitindo a visualização e avaliação espacial da informação.
No entanto, esses tabuladores apresentam limitações quanto à análise de dados. Os
tabuladores permitem a análise de totais, ou somatórios gerais, o que impossibilita a pesquisa
com o viés de mineração de dados. Além disso, refletindo a complexidade da saúde pública
brasileira, o site do DATASUS apresenta uma série de dificuldades para o acesso às informações
em saúde. Segundo Morais et al. (2014), há falhas e falta de integração entre os sistemas de
informação.
32
2.3 Fundamentos Estatísticos e Métodos de previsão
O presente estudo utiliza-se de conceitos estatísticos e métodos de previsão para a
descoberta de conhecimento em base de dados. Há diversos métodos para previsão e a escolha
dos mais apropriados, para testá-los, é baseado nas características que os dados possuem.
Especificamente em relação ao presente estudo, que analisa séries temporais, as características
dos dados que devem ser consideradas são: tendência, sazonalidade, ciclos e irregularidades. Serão
testados nas séries temporais dos Capítulos do NCM sete métodos, sendo que esses métodos estão
separados em três grupos. No primeiro grupo estão os métodos de previsões, que utilizam-se dos
conceitos de médias, médias ponderadas e as últimas observações. No segundo grupo estão os
métodos de previsões, que utilizam-se dos conceitos de suavização exponencial. Este conceito
utiliza-se de médias ponderadas de observações passadas, com os pesos decaindo exponencialmente
à medida que as observações envelhecem. Dessa forma, a mais recente observação possui um
maior peso. No terceiro grupo estão os métodos que utilizam-se de dois outros conceitos: a
autoregressão (AR)(que prevê a variável de interesse usando uma combinação linear dos valores
passados) e o moving average (MA) ou média móvel (que usa erros de previsão do passado em
um modelo de regressão) (HYNDMAN; ATHANASOPOULOS, 2014).
Além dos métodos de previsão, no presente estudo serão descritos os conceitos estatísticos
utilizados na descoberta de novos conhecimentos.
2.3.1 Método ARIMA(1,1,1)(0,0,1)
Enquanto os modelos de suavização exponencial foram baseados em uma descrição de
tendência e sazonalidade nos dados, modelos ARIMA visam descrever as autocorrelações nos
dados (HYNDMAN; ATHANASOPOULOS, 2014). Assim, o presente modelo é classificado
no terceiro grupo de métodos e também possui a vantagem de gerar intervalos de previsão.
Os métodos ARIMA utilizam-se de transformações de dados, como logaritmos, para ajudar
a estabilizar a variância de uma série temporal. Isso permite a transformação de uma série
temporal não estacionária em estacionária. Isso é conhecido como a diferenciação, ou differencing.
Differencing pode ajudar a estabilizar a média de uma série de tempo por meio da remoção de
alterações no nível de uma série de tempo, e assim eliminando tendência e sazonalidade. Em um
modelo de autoregressão (AR). Na previsão da variável de interesse, é utilizado uma regressão
dessa variável contra si mesma. Mas, ao invés de usar valores passados da variável previsão em
uma regressão, um modelo de média móvel (MA) usa os erros de previsão do passado em um
modelo de regressão. Os parâmetros do método são compostos da seguinte forma:
Figura 8 – Observado x Previsão
33
2.3.2 Método da ETS (AAdN)
Se encaixa também no segundo grupo, mas possui a vantagem de gerar intervalos de
previsão. O método possui três parâmetros: erro, tendência e sazonalidade. Portanto, é necessário
primeiramente a confirmação das características dos dados a serem analisados, para posteriormente
utilizar os parâmetros corretos no método. Ao considerar as variações na combinação da tendência
e sazonalidade, é possível combinar quinze métodos de suavização exponencial (KABACOFF,
2015).
Quando há sazonalidade, esta pode ser aditiva ou multiplicativa. No entanto, vamos
considerar que todas as séries temporais aqui estudadas não possuem sazonalidade. Assim, para
classificar os métodos de suavização, é possível combinar as seguintes possibilidades de tipos de
tendência com a ausência de sazonalidade:
Tendência Sazonalidade
Nenhuma
Nenhuma NN
Aditiva AN
Aditiva Amortecida AdN
Multiplicativa MN
Multiplicativa Amortecida MaN
Tabela 2 – Métodos de Suavização
Assim, utilizaremos para a previsão das séries temporais aqui utilizadas, os parâmetros
AAdN, mais precisamente, a série será Aditiva, com tendência suavizada (A) mas sem sazonalidade
(N).
2.3.3 Correlação
Utilizando-se da estatística bivariada, em que o coeficiente de correlação é o mais
comumente usado,mede-se a força da relação entre as variáveis x e y. O valor da correlação (r)
sempre se situa entre -1 e 1, inclusive, com os valores negativos indicando uma baixa relação e
valores positivos indicando uma forte relação. Abaixo, três diagramas de dispersão, para visualizar
os tipos de correlação:
34
Figura 9 – Gráficos de Correlação
Fonte: (GERIRONLINE, 2017)
Há três formas de gráficos de dispersão na Figura 9. Esses gráficos de dispersão retratam
relações lineares, ou seja, quando se constrói o gráfico, os pontos (ou dados), se aproximam de
uma reta. Observando o eixo x, da esquerda para direita, o gráfico (a) apresenta um padrão,
uma correlação positiva para os dados, haja vista que os dados tendem para cima. O gráfico (b)
representa uma correlação negativa, indicando que os dados tendem para baixo. Já o gráfico (c)
não possui tendência, o que demonstra não haver correlação. Mais especificamente, correlação
positiva significa que, quando a variável x aumenta, a variável y também aumenta. Correlação
negativa é quando a variávels x aumenta e a variável y apresenta diminuição nos valores.
2.3.4 Método Estatístico
As previsões estão presentes nas ciências e também nas mais diversas áreas de negócios,
como: saúde, educação, transporte e outros. Considerada uma tarefa estatística, tem por objetivo
contribuir para a melhora nas tomadas de decisões, possibilitando que o planejamento das organi-
zações tenha um horizonte mais realista. Os sistemas de previsão são dinâmicos, exigindo serem
reavaliados constantemente, o que resulta na necessidade do desenvolvimento de competências
de previsão dentro da organização. Determinar o que será previsto, qual o problema que a
organização possui e como uma eventual previsão colaboraria para solução do mesmo é essencial.
Mas não há como realizar previsões se não tiver a matéria-prima que serve de base para a
construção desta tarefa: isto é, os dados. Fonte das previsões e da criação de novos conhecimentos,
os dados têm papel fundamental na vida das organizações. Com esse pressuposto, as organizações
necessitam adotar a governança de dados, entendendo que esses são ativos estratégicos, que
exigem a implantação de políticas efetivas quanto à privacidade, segurança e utilização dos dados
(DAMA, 2016). Consequentemente, as previsões são dependentes da qualidade e quantidade de
dados que são disponibilizados pelas organizações.
35
Para realizar a tarefa de previsão, é necessária a construção de um modelo, ou método
estatístico para tal. Há diversos métodos para a utilização, cada qual com seus pressupostos
peculiares, o que muitas vezes colabora para dificultar a escolha (FLORES, 2009). Escolhido o
método, o real desempenho só poderá ser avaliado quando os dados para o período de previsão se
tornaram disponíveis. O que se pretende prever é denominado de variável aleatória. Por exemplo,
as previsões de desistência de alunos de graduação do próximo mês, de certa universidade, pode
ser uma série de valores possíveis. Até que se finalize o mês e tenhamos a quantidade real, a
quantidade projetada é aleatória. Prever essa desistência para o próximo mês é mais simples do
que prever a desistência daqui a dois anos. Isso significa que quanto mais à frente for a previsão,
mais incerta é a mesma. Portanto, definir o horizonte de previsão colabora para o aumento do
grau de confiança, possibilitando que a organização elabore um planejamento mais realista para
o cenário futuro.
2.3.5 Conjuntos de Treinamento e Teste
A avaliação da precisão das previsões torna-se mais acurada quando utiliza-se de dados
originais. Para tal objetivo, o conjunto de dados que formam a série temporal, ou outra forma
qualquer de representação gráfica, é separado em duas partes. A primeira parte é denominada
como a parte de treinamento do modelo. Essa parte é utilizada para a etapa de construção do
melhor modelo de previsão. Nessa construção, deverão ser consideradas todas as características
que estes dados possuem, como distribuição, média, linearidade, tendências e outros. Existem
infinitas possibilidades de modelos e, inicialmente, a escolha dos mais apropriados é mediante a
análise gráfica dos dados. Assim, após separada a parte dos dados que servirá para o treinamento
do modelo, vem a segunda etapa, que é denominada de teste.
Nessa segunda etapa, o segundo conjunto de dados é confrontado com os modelos de
previsão, ou seja, os modelos são testados com dados reais. Isso possibilitará a avaliação, ou
"teste", de como os modelos se comportam na previsão frente a um cenário realista, que são
justamente os dados históricos que formam o conjunto de teste. A partir desse teste, é produzida
uma série de erros residuais para cada um dos modelos testados.
2.3.6 Erros residuais
A escolha do melhor modelo é baseada no seu respectivo diagnóstico residual. Os resíduos
do modelo são formados pelos erros de previsão (e). O e mede a precisão das previsões, ou seja,
a diferença entre o ocorrido e o previsto. Para tanto, é necessário consideramos que yi denota
uma observação ith (ocorreu) e ŷi denota uma predição para yi (previsão). Assim, a fórmula
para o erro de previsão será e = yi − ŷi, em outras palavras, o confronto entre o previsto e o
observado (o que realmente ocorreu), representado pela Figura 10:
36
Figura 10 – Observado x Previsão
Fonte: O Autor
De acordo com Samohyl et al. (2008), as principais metodologias para avaliar a qualidade
das previsões é utilizando-se dos seguintes índices de erros residuais:
Medida Abreviação Característica
1 Mean error ME Erro médio
2 Mean absolute error MAE Erro médio absoluto
3 Mean Squared error MSE Erro médio Quadrático
4 Root mean squared error RMSE Raiz do erro médio quadrado
5 Mean absolute percentage error MAPE Erro percentual absoluto médio
6 mean absolute scaled error MASE Erro escalado média absoluta
Tabela 3 – Medidas de cálculo de erro de previsão
Fonte: (HYNDMAN; ATHANASOPOULOS, 2014)
Dessa forma, os modelos de previsão são avaliados por meio dos cálculos adotados pelas
medidas apresentadas na Tabela 3. Consequentemente, o modelo com menor resíduo tende a ser
o mais adequado. Mais precisamente, essas medidas de cálculo de erro de previsão fornecem um
diagnóstico, indicando qual modelo melhor se adapta ao padrão dos dados.
Quando da separação do conjunto de dados original, o conjunto de dados denominado de
teste deve possuir cerca de 20% do total da amostra, embora esse valor dependa de quanto tempo
à frente será a previsão. O tamanho do conjunto de teste deve ser pelo menos tão grande quanto
o horizonte de previsão (HYNDMAN; ATHANASOPOULOS, 2014). O restante dos dados são
então para o conjunto de treinamento.
2.3.7 Séries Temporais
Séries temporais podem ser definidas como sendo a distribuição de valores quantitativos
ao longo de um determinado período. Segundo Wiener (1949), séries temporais são "sequências
de dados quantitativos relativos a momentos específicos e estudados segundo sua distribuição
no tempo". Assim, os dados devem seguir uma ordem cronológica, sem lacunas, para que haja
condições para a análise do seu comportamento. Séries temporais possuem componentes que
descrevem seu comportamento em relação ao passado e criam condições para projetar seu possível
comportamento no futuro. Uma das características mais importantes das séries temporais é que
37
as observações vizinhas são interdependentes, e a análise dessa dependência gera um modelo
matemático útil para projeções futuras.
Existem cinco métodos mais comuns para previsão econômica por meio de séries temporais
(GUJARATI; PORTER, 2011). O presente estudo terá foco no método de suavização exponencial e
a autoregressão (AR) e o moving average (MA) ou média móvel, conhecido como método ARIMA.
Uma série temporal, de acordo com Hyndman e Athanasopoulos (2014), possui os seguintes
componentes: tendência, sazonalidade, ciclos e irregularidades. Por meio da decomposição da série
temporal nesses quatro componentes é possível entender seu comportamento e, consequentemente,fazer previsões.
I Tendência
Uma tendência existe quando se verifica um aumento ou diminuição no comportamento
macro dos dados em longo prazo. Mais precisamente, é um movimento prolongado em uma série
temporal (PORTA, 2008), não podendo ser confundido com movimentos curtos e momentâneos
dos dados.
Figura 11 – Linha de tendência (em branco)
Fonte: O Autor
Como observado na Figura 5, os dados têm um comportamento de subidas e descidas
no curto prazo, no entanto, em longo prazo, tendem a ter um comportamento de elevação,
representado pela linha de cor branca. A tendência pode ser classificada em cinco tipos: nenhuma,
aditiva, aditiva amortecida, multiplicativa e multiplicativa amortecida (MARTIN et al., 2016).
II Sazonalidade
Algumas séries temporais possuem comportamentos que tendem a se repetir a cada
período de tempo. Por exemplo, vendas de camisas da seleção brasileira tendem a crescer
em períodos próximos às Copas do Mundo. Esse padrão tende a ser repetido nos anos em
que se realiza a Copa do Mundo. Com essa lógica, sazonalidade, em uma série temporal, é a
38
característica de apresentar repetições organizadas no tempo (ANTUNES; CARDOSO, 2015).
Sazonalidade é pautada por uma visível alteração de comportamento, com picos e quedas,
abruptas e padronizadas, ao longo do período observado, conforme gráfico de exemplo:
Figura 12 – Séries temporais de temperatura mínima e máxima
Fonte: (CHECHI; BAYER, 2012)
Fica evidente que há picos de aumento de temperatura (verão) e quedas de temperaturas
(inverno), o que caracteriza a sazonalidade dos dados. Como mais um exemplo, observe a Figura
13:
Figura 13 – Séries temporais com Sazonalidade
Fonte: (HYNDMAN; ATHANASOPOULOS, 2014)
Verifica-se na Figura 13 que há uma tendência para cada um dos meses, em uma maneira
mais ou menos uniforme. Além disso, o maior número de passageiros ocorre em julho e agosto,
e uma diminuição em fevereiro e novembro para todos os anos. Isso demonstra uma padrão
semelhante, com aumentos e diminuições nas mesmas épocas do ano, o que explicita um padrão
39
sazonal.
III Multiplicativa e Aditiva
Tanto a sazonalidade quanto a tendência podem ser classificadas de aditivas ou multipli-
cativas. A Figura 14 apresenta dois gráficos representando uma série temporal aditiva e uma
multiplicativa. Observando esta Figura, fica evidente que o Gráfico (a) possui uma tendência
de crescimento conservador, com oscilações constantes, mas de pouca amplitude. Já o Gráfico
(b) possui uma tendência e sazonalidade menos conservadora, com os dados oscilando, entre a
mínima e máxima, em uma escala maior no passar do tempo.
Figura 14 – Gráfico (a) de uma série Aditiva e Gráfico (b) de uma série Multiplicativa
Fonte: (HYNDMAN; ATHANASOPOULOS, 2014)
IV Ciclos
Um ciclo dentro de uma série temporal são flutuações que se repetem por um período
não determinado, ou não padronizado, ao contrário da sazonalidade, que possui um padrão.
O ciclo ocorre quando os dados sobem ou descem por um determinado período fixo. Essas
flutuações são geralmente devido a condições, ou cenários momentâneos, em que os estudos estão
inseridos, como ciclos de negócios, ciclos econômicos ou ainda ciclos meteorológicos (HYNDMAN;
ATHANASOPOULOS, 2014). Esses ciclos podem ser de alta ou baixa, ou ainda ciclos não
determinados. Os ciclos seguem as tendências, ou seja, são comportamentos de longo prazo.
V Irregularidades
O componente irregular (ou de erro) capta o comportamento da série que não pode
ser descrito nem pela tendência, nem pelos efeitos sazonais. O componente irregular, segundo
(DOWNING; CLARK, 2002), existe pelo fato de haver algum movimento que não é explicável
por tendência ou ciclos.
VI Estacionariedade
Uma série temporal estacionária é aquela cujas propriedades não dependem do momento
em que a série é observada. Logo, séries temporais com tendências, ou com sazonalidade, não
são estacionárias, haja vista que essas características irão afetar o valor da série histórica em
diferentes momentos. Uma série temporal estacionária irá se desenvolver no tempo aleatoriamente
ao redor de uma média constante, exibindo uma característica de equilíbrio estável. A maioria das
séries reflete algum tipo de não estacionariedade, como, por exemplo, uma tendência (ACTION,
2016). Abaixo, seguem dois exemplos de séries temporais:
40
Figura 15 – Gráfico (a) sem tedência definida e Gráfico (b) com tendência em queda
Fonte: (HYNDMAN; ATHANASOPOULOS, 2014)
Nota-se que o gráfico (a), da Figura 15, não apresenta qualquer tendência ou sazonalidade,
caracterizando uma série temporal estacionária. Já o gráfico (b) possui uma tendência negativa,
caracterizando uma série não estacionária.
Uma maneira de determinar mais objetivamente se há estacionariedade na série é realizar
o teste de raiz unitária, por meio do teste de Dickey-Fuller (ADF). A hipótese nula para um teste
ADF é que a série temporal seja não estacionária. Assim, se o p-valor tiver grandes valores, é um
indicativo de não estacionariedade. Já p-valores pequenos sugerem estacionariedade. Usando o
limiar de 5% habituais, a série é não estacionária se o p-valor for maior do que 0.05.
2.4 Revisão Sistemática
Para determinar qual metodologia a ser utilizada foi realizado um estudo de revisão
sistemática:
Uma revisão sistemática, assim como outros tipos de estudo de revisão, é
uma forma de pesquisa que utiliza como fonte de dados a literatura sobre determinado
tema. Esse tipo de investigação disponibiliza um resumo das evidências relacionadas a
uma estratégia de intervenção específica, mediante a aplicação de métodos explícitos
e sistematizados de busca, apreciação crítica e síntese da informação selecionada
(SAMPAIO; MANCINI, 2007, pg. 84).
Nesta revisão, foram explorados artigos, estudos, dissertações e outros que abordassem
temas como: inteligência nas organizações públicas de saúde, integração de sistemas de informações
em saúde, ambiente para extração de informações de saúde a partir de bases de dados do SUS,
descoberta de conhecimento e informações de forma estratégica para a tomada em saúde. A partir
desses estudos, optou-se pela metodologia KDD, por ser uma metodologia testada em diversos
estudos acadêmicos. Foram realizadas buscas em bases de dados eletrônicas, tanto nacionais
quanto internacionais, utilizando as palavras "gestão do conhecimento", "datasus", "mineração de
dados", "knowledge management", "data mining". Além disso, o período pesquisado foi de 2009
até 2015. Os motores de busca utilizados foram o Google Academics, LILACS e MEDLINE, e
estes retornaram o total de 106 estudos. Após, foi feita a filtragem desses estudos: inicialmente
41
pelos títulos e resumos e, em seguida, pela análise do artigo completo. O critério de análise, para
a escolha dos estudos relevantes, é que estes deveriam fazer a mineração de dados públicos de
saúde. Na Tabela 4 são apresentados tanto o objetivo quanto um resumo dos resultados dos
artigos considerados relevantes para este estudo:
TÍTULO OBJETIVO RESULTADOS
Inteligência nas organizações
públicas de saúde: soluções e
informações estratégicas para
gestão (FROTA, 2009).
Identificar e explorar no âm-
bito da literatura e de algumas
experiências de organizações
da administração indireta na
área da gestão da informação
os limites e as possibilidades
da adoção das tecnologias Bu-
siness Intelligence - BI e Inte-
ligência Competitiva - IC para
a área da saúde e, particular-
mente, para o DATASUS
Revelou que há experiências
concretas de incorporação da
IC e do BI em várias áreas
de atuação, com resultados
expressivos e maior eficiên-
cia para as empresas. Nas
organizações da administra-
ção indireta brasileira visita-
das, verificou-se uma constru-
ção ainda incipiente dessa área,
contudo com forte direciona-
mento para sua incorporação.
Na área da saúde foram encon-
tradas poucas experiências.
Ambiente de informações para
apoio à decisão dos gestores do
controle do câncer de mama
(MARTINS, 2009).
Contribuir para o enfrenta-
mento deste amplo desafio, a
Gestãoda Informação e a Ges-
tão do Conhecimento apresen-
tam um conjunto de processos,
técnicas e ferramentas cuja
aplicação pode representar um
avanço na gestão das ações de
Saúde Pública.
Conduziu à hipótese de sugerir
a organização de um ambiente
de informação, inovador, cri-
ado no ciberespaço, utilizando
intensivamente tecnologias da
informação, articuladas com
métodos de modelagem estatís-
tica, modelagem matemática
e a inteligência computacio-
nal incorporando a perspectiva
espacial e temporal, e concei-
tos da Gestão da Informação
e Gestão do Conhecimento.
Uso de informações de saúde
para suporte à decisão: uma
metodologia focada no consu-
midor da informação (AZE-
VEDO, 2009).
Apresentar os passos necessá-
rios para a construção de data
marts /data warehouses como
uma solução para um ambiente
de suporte à decisão.
Disseminação das informações
contidas nestes bancos de da-
dos para os diversos tipos de
consumidores da informação
(com diferentes recursos de
hardware, software e humanos
disponíveis), e sua aplicação
no controle social.
42
Integração de sistemas de in-
formações em saúde. Uma pro-
posta de solução para a melho-
ria da qualidade na gestão do
SUS (JUNIOR, 2009).
Revisitar o histórico, proces-
sos, técnicas, métodos e ativi-
dades já desenvolvidas na cons-
trução do Integrador, assim
como análise do Registro Ele-
trônico de Saúde, Base de Da-
dos e do Site Integrador Muni-
cipal.
Observou o emprego de lingua-
gens de programação e tecno-
logias de banco de dados di-
versificadas, acarretando pro-
blemas sérios de portabilidade
e dificuldades na interopera-
ção desses sistemas. Essa ver-
dadeira profusão de dialetos e
técnicas acarreta retrabalho e
um aumento injustificável para
integração das informações.
Ambiente para extração de in-
formações de saúde a partir de
bases de dados do SUS (PIRES
et al., 2011).
A aplicação de técnicas para
produção de informação geren-
cial e descoberta de conheci-
mentos em grandes bases de
dados, como as existentes nos
sistemas de informação do DA-
TASUS, pode representar um
avanço substancial na gestão
do Sistema Único de Saúde
(SUS).
Foram realizados diversos tes-
tes para avaliar a funcionali-
dade e a efetividade das ferra-
mentas criadas, com ênfase em
aplicações de cardiologia. Os
resultados evidenciaram a efe-
tividade das ferramentas nos
aspectos mais complexos da
gestão de informações para
desenvolver conhecimentos, a
partir das bases de dados do
DATASUS.
Descoberta de conhecimento
aplicado à base de dados tex-
tual de saúde (BARBOSA,
2012)
Extrair padrões que, por meio
de sua interpretação, resultem
na produção de conhecimento,
sejam aplicados aos conjuntos
de interesse de técnicas de clas-
sificação e associação, visando
à relação entre o conteúdo tex-
tual que descreve sintomas de
doenças com o conteúdo pré-
estruturado, que define o diag-
nóstico destas doenças.
Os resultados acima de 80
por cento de Acurácia, de-
monstrando capacidade do
algoritmo de rotular dados
da saúde relacionados ao do-
mínio de interesse correta-
mente. Também foram desco-
bertas associações entre con-
teúdo textual e conteúdo pré-
estruturado que, segundo a
análise de especialistas, podem
conduzir a questionamentos
quanto à utilização de determi-
nados CIDs no local de origem
dos dados.
43
The effectiveness of knowledge
translation strategies used in
public health: a systematic re-
view (LAROCCA et al., 2012).
Identificar a eficácia das estra-
tégias KT utilizadas para pro-
mover a tomada de decisões ba-
seadas em evidências (eIDM)
entre os decisores de saúde pú-
blica.
Nenhuma estratégia KT singu-
lar foi demonstrada ser eficaz
em todos os contextos. Conclu-
sões sobre as intervenções não
podem ser tomadas por conta
própria, sem considerar as ca-
racterísticas do conhecimento
que estava sendo transferido,
fornecedores, participantes e
organizações.
The Use of Information Sys-
tems in Health Care Facili-
ties:A Brazilian Case (COR-
REIA et al., 2013).
Avaliar o grau de maturidade
que as instituições de saúde
possuem em relação à tecno-
logia da informação, ou seja,
como as instituições utilizam
sistemas de informação e como
se aplica este sistema na ges-
tão da informação.
Mostram que há uma preocu-
pação ao usar Informações de
forma estratégica para a to-
mada de decisão, embora o de-
senvolvimento não siga uma
forma ascendente curvilínea e
não inclua recursos de análise
de dados complexos.
Proposta de Gestão da Trom-
bose Venosa Profunda Através
de Mineração de Dados (CLE-
MENTE et al., 2013).
Identificar a melhor forma de
compreender e analisar os da-
dos resultantes do monitora-
mento da Trombose Venosa
Profunda de forma eficaz.
Devido à grande quantidade
de dados que envolvem o pro-
blema, torna a análise humana
inviável. Propomos a minera-
ção de dados para melhor ge-
renciamento destes dados.
How can knowledge exchange
portals assist in knowledge
management for evidence-
informed decision making in
public health? (QUINN et al.,
2014)
Portais de intercâmbio de co-
nhecimentos estão emergindo
como ferramentas web que po-
dem ajudar a facilitar a ges-
tão do conhecimento em saúde
pública. Foi realizada uma re-
visão para melhor compreen-
der a natureza desses portais e
sua contribuição para a gestão
do conhecimento em saúde pú-
blica, com o objetivo de infor-
mar o futuro desenvolvimento
de portais neste campo.
Portais de troca de conheci-
mento podem ser uma plata-
forma para fornecer acesso in-
tegrado a conteúdo e recursos
relevantes em um único local,
para compartilhar e distribuir
informações e para reunir as
pessoas para a troca de conhe-
cimento. No entanto, estudos
de avaliação de desempenho
são necessários para determi-
nar como eles podem melhor
apoiar a decisão com base em
evidências, colaborando com a
saúde pública.
Tabela 4 – Revisão Sistemática
Fonte: O Autor
44
Observando os estudos anteriores, que atenderam aos critérios de pesquisa, nota-se que
existe uma preocupação de inovar e melhorar a gestão pública de saúde, por meio da utilização
de ferramentas de apoio à decisão. A vasta quantidade de dados disponíveis nas bases de dados
públicas no Brasil permite que haja geração de conhecimento por meio da mineração de dados.
No entanto, detectou-se pouca atividade de pesquisa com o objetivo de criar e disseminar novos
conhecimentos a partir dos dados públicos de saúde no Brasil. Salienta-se que essa revisão foi
publicada e o artigo encontra-se nos anais do Simpósio Internacional Interdisciplinar em Ciências
Sociais Aplicadas Tema: Desenvolvimento, Gênero e Condição de Pobreza(BUZETI et al., 2016).
45
3 Metodologia
O conhecimento científico é diferente do conhecimento popular por ter uma fundamentação
e metodologia a serem seguidas. Baseia-se em informações classificadas, possui verificações e
oferece explicações plausíveis a respeito do objeto ou evento em questão (PRODANOV; FREITAS,
2013). Há ainda a definição de pesquisa como instrumento essencial para a resolução de problemas
coletivos (MARCONI et al., 1999).
A metodologia utilizada na elaboração deste estudo foi de natureza aplicada. Quanto
aos objetivos, é exploratória com abordagem quantitativa, para fins descritivos, por meio de
fontes secundárias de dados. Realizou-se procedimentos de pesquisa bibliográfica e experimental,
aplicando o estudo de caso nos sistemas ALICEWeb e DATASUS. A abordagem quantitativa
é aquela em que se podem transformar informações em números e, a partir desses números,
produzir análises e classificações. Definida por Richardson et al. (1985) como um método que se
caracteriza pelo emprego da quantificação, tanto nas modalidades de coleta de informações quanto
no tratamento destas por meio de técnicas estatísticas. A pesquisa para fins descritivos, conforme
Alís (1985), visa a descrever as características de determinada população, ou fenômeno, ou o
estabelecimento de relações entre variáveis. Envolve-se o uso de técnicas padronizadas de coleta
de dados: questionário e observação sistemática. Assume, em geral, a forma de levantamento.3.1 Delineamento da pesquisa
Para se atingir o objetivo geral deste estudo, foram elaboradas as seguintes questões de
pesquisas:
1 Quais são as premissas e os conceitos de Gestão do Conhecimento e tecnológicos que
serão necessários para fundamentar a pesquisa?
2 Como propor um modelo para solucionar o problema proposto?
3 Como cruzar e analisar as informações nos dois sistemas, DATASUS e ALICEWeb ?
3.1.1 Premissas e conceitos de Gestão do Conhecimento e tecnológicos
Para se atender aos requisitos da pergunta 1, foi realizada uma pesquisa bibliográfica con-
templando todos os conceitos que serão utilizado neste trabalho, como Gestão do Conhecimento,
KDD, Mineração de Dados, Gestão do Conhecimento em saúde pública no Brasil, Fundamentos
Estatísticos e Métodos de previsão e, por fim, uma revisão sistemática de trabalhos relacionados
ao tema em questão.
3.1.2 Modelo para solucionar o problema proposto
Para atender a questão 2, foi proposto um Modelo de KDD baseado em Fayyad (1996),
que denominamos Modelo Buzeti. Conforme Figura 16 (página 47), o modelo é composto por
cinco etapas:
46
Figura 16 – Modelo Buzeti para Descoberta de Conhecimento nas Bases de Dados dos Sistemas
ALICEWeb e SIH - SUS
Modelo Buzeti
47
• Etapa 01 - Seleção de dados: são escolhidos os conjuntos de dados que farão parte da
descoberta do conhecimento.
• Etapa 02 - Pré-processamento e limpeza de dados: a construção de um banco de dados de
qualidade se inicia nesta etapa, por meio de processos de eliminação, redução e modificação
do banco de dados.
• Etapa 03 - Transformação dos dados: os dados são transformados em um formato de
interesse do processo de mineração.
• Etapa 04 - Mineração de Dados: são feitas as explorações e a análise dos dados, criando e
descobrindo novos conhecimentos.
• Etapa 05 - Análise e interpretação do cruzamento das informações nos dois sistemas
(DATASUS e/ou ALICEWeb): são analisados os resultado obtidos pela Mineração.
A partir do modelo Buzeti proposto, serão detalhadas todas as fases de descoberta de
conhecimento, primeiramente, para os dados do sistema ALICEWeb e, então, para o sistema
DATASUS.
3.1.3 Cruzar e analisar as informações nos dois sistemas, DATASUS e ALICEWEB
Para atender à terceira questão de pesquisa e parte da quinta etapa do Modelo Buzeti,
foram realizadas as análises e a interpretação do cruzamento das informações nos dois sistemas
(DATASUS x ALICEWeb), conforme Figura 17:
Figura 17 – Problemática de Pesquisa
Fonte: O Autor
Além da fundamentação teórica para tal cruzamento, foi necessária ainda a conclusão de
todas as etapas que envolvem o KDD e ainda o Modelo Buzeti. Foi ainda desenvolvida uma rotina
específica para essa finalidade, considerando que as bases de dados estavam preparadas para
análise. Após as bases de dados estarem devidamente preparadas, o cruzamento foi analisado
por profissionais da área da saúde. O cruzamento resultou em milhares de correlações, as quais
foram avaliadas se eram espúrias ou não.
3.2 Outras considerações, uso do Pacote R e Latex
Para análise e mineração de dados, foi utilizado o software R (R Core Team, 2014a). A
escolha desse software é em função de ser um software livre, com diversos pacotes para estatística,
48
gráficos e exploração de dados. Quando comparado ainda a outras ferramentas disponíveis no
meio acadêmico, o pacote R é uma ferramenta robusta e confiável (ALMIRON et al., 2010). Além
disso, é um ambiente em constante evolução, com milhares de desenvolvedores disponibilizando
pacotes de análise por meio de sua rede de distribuição Comprehensive R Archive Network
(CRAN). Assim, a linguagem escolhida adapta-se às características do estudo e à proposta de
criação do conhecimento. A interface gráfica escolhida para este estudo foi o R Studio.
A geração do relatório dinâmico é por meio do LaTex (PROJECT, 2017), que é um
sistema tipográfico de alta qualidade, que inclui funcionalidades concebidas para a produção de
documentação técnica e científica. O LaTeX é o padrão para a comunicação e a publicação de
documentos científicos e está disponível como software livre.
É relevante notar que a forma tradicional de redigir um relatório em um projeto de
análise de dados estatísticos é por meio de duas etapas: primeiro, os dados são analisados, e,
depois, os resultados da análise (números, gráficos, tabelas etc.), com características estáticas,
são utilizados como base para um relatório escrito. Em projetos maiores, as duas etapas podem
ser repetidas alternadamente (LEISCH, 2002). No entanto, no presente estudo, optou-se por uma
forma diferente na construção e no desenvolvimento de sua estrutura. Este estudo possui uma
estrutura dinâmica, que é atualizada automaticamente, caso ocorra também alguma mudança
nas estruturas de dados. Ao invés de inserir um gráfico ou uma tabela no formato de figura
estática no relatório, o documento mestre contém o código R necessário para construí-la. Ou
seja, quando executado, por meio do R, toda a saída de análise de dados (tabelas, gráficos,
etc.) é compilada no momento e introduzida em um documento LATEX final. O relatório será
atualizado automaticamente sempre que os dados ou a análise mudarem, o que permite uma
reprodução verdadeiramente real da pesquisa (LEISCH, 2002).
Essa característica do estudo é possível por meio do pacote knitr (XIE, 2014), o qual foi
projetado para (1) ser um mecanismo para geração de relatórios dinâmicos com R e (2) combinar
recursos em outros pacotes add-on, ou seja, outros pacotes utilizados pelo próprio R.
Para a criação do conhecimento, por meio das fases da metodologia KDD, foram utilizados
ainda pacotes do softwares R. Conforme a Tabela 5, foram utilizados 12 pacotes, com diversas
finalidades, para as fases da mineração de dados e a criação do conhecimento.
Referência Nome/Descrição
1 (RUDIS, 2015) waffle: Create Waffle Chart Visualizations in R
2 (WICKHAM, 2009) ggplot2: Elegant Graphics for Data Analysis
3 (DAHL, 2016) xtable: Export Tables to LaTeX or HTML
4 (WICKHAM, 2011) plyr: The Split-Apply-Combine Strategy for Data Analysis
5 (HYNDMAN; KHAN-
DAKAR, 2008)
forecast: Automatic time series forecasting
6 (FEENSTRA et al.,
2015)
pwt8: The Next Generation of the Penn World Table
7 (R Core Team, 2014b) utils: R: A Language and Environment for Statistical Com-
puting
49
8 (MURRELL, 2015) compare: Comparing Objects for Differences
9 (GROTHENDIECK,
2014)
sqldf: Perform SQL Selects on R Data Frames
10 (JOSEPH, 2016) compareDF: Do a Git Style Diff of the Rows Between Two
Dataframes with Similar Structure
11 (SARKAR, 2008) Lattice: Multivariate Data Visualization with R
12 (HYNDMAN, 2013) fpp: Data for "Forecasting: principles and practice"
Tabela 5 – Pacotes Utilizados
Fonte: O Autor
50
4 Análise e discussão dos resultados
Este Capítulo apresenta os resultados do estudo a partir da utilização da metodologia
KDD e do modelo Buzeti. Esses resultados foram divididos em três partes, sendo a primeira os
resultados para o sistema ALICEWeb, a segunda para o sistema DATASUS e a terceira parte a
análise dos resultados do cruzamento dos dois sistemas citados anteriormente.
4.1 Sistema ALICEWeb
Com a criação do Fundo Monetário Internacional (FMI) e a necessidade de contabilizar as
estatísticas de comércio exterior, foi iniciado o processo de registro dos movimentos de comércio
entre os países. Em 1971, o Banco do Brasil, utilizando-se de mainframes, começa a elaborar
publicações periódicas de estatísticas de comércio exterior. Em 1991, é implantado o Sistema
ALICE pelo Serviço Federal de Processamento de Dados (SERPRO), mediante acesso on-line.
A implantação do SISCOMEX-Exportação, em 1993, focou a automação dos procedimentos
operacionais e burocráticos, com o objetivo de reduzir os custos para o Governo e para o setor
privado. Com a substituição dos documentos (guia e declaração de exportação) por registros
eletrônicos, a produção das estatísticas de comércio exterior ganhou significativo avanço. Em
1997, ampliou-se o processo de desburocratizaçãopor meio da mudança de rotinas baseadas
em documentos, como a substituição da Guia de Importação por registros eletrônicos. Também
em 1997, o Brasil passou a utilizar a Nomenclatura Comum do Mercosul (NCM), utilizada
igualmente pelos demais países partícipes (Argentina, Paraguai e Uruguai) (ALICEWEB, 2016).
O sistema ALICEWeb, da Secretaria de Comércio Exterior, do Ministério do Desen-
volvimento, Indústria e Comércio Exterior, foi desenvolvido com o objetivo de modernizar a
disseminação das estatísticas brasileiras de exportações e importações. O objetivo do sistema
ALICEWeb é retirar os dados do Sistema Integrado de Comércio Exterior (SISCOMEX), no
qual os próprios exportadores-importadores fornecem as informações relativas às operações. A
seguir, serão descritas as etapas do Modelo Buzeti para descoberta de conhecimento no Sistema
ALICEWeb.
Etapa 01 - Seleção de dados
O site ALICEWeb possui um tutorial (ALICEWEB, 2017) para apresentação do sis-
tema. O Tutorial foca principalmente as possibilidades de consultas, descrevendo as seguintes
alternativas:
• Consultas com um ou mais parâmetros definidos;
• Consultas com nenhum, um ou mais parâmetros definidos e utilização das caixas de
detalhamento do filtro;
• Consultas utilizando os módulos de municípios;
• Consultas com a opção apenas total geral;
• Consultas com o módulo balança comercial;
51
• Consultas utilizando a faixa de mercadorias.
Para acessar o sistema, é necessário preencher o formulário de cadastro. O formulário
de cadastro exige informações básicas do usuário, como o Nome Completo, CPF, Endereço,
Profissão, Usuário, Senha e outros. Após cadastrado, imediatamente o usuário tem acesso aos
dados disponíveis no site.
A NCM forma a base para a classificação de mercadorias nas operações de comércio
exterior do Brasil. A NCM utiliza um código de oito dígitos numéricos. Cada código corresponde
a uma designação de mercadoria comum a todos os países membros.
A base para a estruturação da NCM é o Sistema Harmonizado de Designação e de
Codificação de Mercadorias, conhecido como Sistema Harmonizado (SH), cuja elaboração e
atualização são de responsabilidade da Organização Mundial de Aduanas (OMA). O MERCOSUL,
para composição de sua nomenclatura própria, adotou os seis dígitos que formam o SH e mais
dois dígitos próprios, para permitir descrições mais detalhadas do que as existentes no SH,
quando necessário. Apesar de todo esse detalhamento, a NCM mostrou-se insuficiente para a
identificação de certos produtos. Nesse sentido, o Brasil decidiu adotar o Detalhamento Brasileiro
de Nomenclatura (DBN), cujo propósito é melhorar o atendimento de necessidades decorrentes
de demandas do setor produtivo e dos órgãos governamentais (DBN, 2016). Assim, o Brasil
acrescentou mais dois dígitos à nomenclatura NCM.
Os oito dígitos que o formam a NCM possuem uma composição hierárquica. Essa
hierarquia permite classificar de forma mais organizada as mercadorias que fazem parte da pauta
de importação e exportação dos países.
Inicialmente, é necessário explorar as regras gerais para interpretação do Sistema Har-
monizado (SH) (BRASIL, 2016). Como já citado, o SH é a base para a estruturação da NCM.
A NCM segue os padrões internacionais de classificação de mercadorias. O código final, ou
NCM-SH, ou apenas NCM, corresponde a uma mercadoria, ou qualquer produto objeto de uma
exportação ou importação. O país importa ou exporta sempre uma mercadoria e sua estrutura de
classificação é baseada na NCM. No entanto, dentro do sistema ALICEWeb, não há somente a
classificação de mercadorias baseadas na NCM, há sim duas classificações, divididas por períodos
distintos:
• de 1989 a 1995: as mercadorias eram classificadas pela Nomenclatura Brasileira de Merca-
doria (NBM-SH).
• de 1996 em diante: mercadorias passam a ser classificadas pela Nomenclatura Comum do
Mercosul (NCM-SH).
Como o estudo considerou dados de 2009 a 2015, foi utilizada apenas a classificação
NCM. A NCM possui uma estrutura hierárquica, que tem por objetivo facilitar as consultas e
organizar os dados. Como exemplo, exibimos o código:
NCM: 01041011 - Animais reprodutores de raça pura, da espécie ovina, prenhe
ou com cria ao pé.
52
Esse código é resultado dos seguintes desdobramentos:
Capítulo 01 Vivos
Posição 0104 Animais vivos das espécies ovina e caprina
Subposição 0104.10 Ovinos
item 0104.10.11 Prenhe ou com cria ao pé
Tabela 6 – Desdobramentos da NCM
Fonte: http://aliceweb.mdic.gov.br/
Essa estruturação, ou classificação, possui seus respectivos quantitativos. Tais quantitati-
vos são também uma forma de dimensionar os dados (DBN, 2016), conforme Tabela 7:
Dígitos Hierarquia Definição Quantitativos
2 SH2 Capítulo 97
4 SH4 Posição 1267
6 SH6 Subposição 6048
8 SH8 NCM 12481
Tabela 7 – Composição da NCM
Fonte: http://aliceweb.mdic.gov.br/
Há, portanto, 97 Capítulos, 1267 Posições e 6048 Subposições. Ainda usando a Tabela 7
como referência, o Brasil importa ou exporta 12481 mercadorias. Todas as transações comerciais
com o exterior estão presentes nesses 12481 itens. Os dados de exportação e importação são
atualizados de três a dez dias úteis após o final do mês. Não há consulta por dia ou por semana,
todas as consultas são por mês de um determinado ano.
Especificamente neste estudo, foram explorados os dados dos capítulos 28, 29 e 30 da
NCM, que se enquadram no Sistema Harmonizado Globalmente para a Classificação e Rotulagem
de Produtos Químicos (GHS). Essa classificação visa à gestão segura de produtos químicos,
objetivando a correta comunicação para todos aqueles potencialmente expostos, incluindo tra-
balhadores, consumidores, equipes de resposta a emergências e o público (ABIQUIM/DETEC,
2005). Mais especificamente, os três capítulos possuem as seguintes descrições:
Capítulo Descrição
28 Produtos químicos inorgânicos, compostos inorgânicos ou orgânicos de
metais preciosos, de elementos radioativos, de metais das terras raras ou
de isótopos
29 Produtos químicos orgânicos
30 Produtos farmacêuticos
Tabela 8 – Capítulos abordados pelo presente estudo
Fonte: O Autor
O objetivo geral do presente estudo é o cruzamento dos dados de importação de fármacos
com as morbidades registradas pelos SUS, portanto, foram analisados apenas os capítulos 28, 29
e 30.
53
Para iniciar o entendimento dos dados disponíveis no site ALICEWeb, foi necessário
explorar as consultas e outras opções disponíveis no menu "Consultas". Nesse menu, há um
total de sete módulos. Em cinco deles, o usuário tem a possibilidade de elaborar as consultas
desejadas. Nos outros dois, o usuário tem acesso às tabelas do sistema, as quais são utilizadas
como referência para entender como o sistema funciona e a ainda como as variáveis de consulta
são classificadas.
As cinco opções de consultas são:
• Exportação: base de dados contendo as exportações brasileiras;
• Exportação Municípios: base de dados contendo as exportações brasileiras incluindo a
variável município;
• Importação: base de dados contendo as importações;
• Importação Municípios: base de dados contendo as importações brasileiras incluindo a
variável município;
• Balança Comercial: módulo de consulta que permite obter em uma só consulta, mediante
fornecimento de parâmetros específicos, a exportação, a importação, o saldo comercial e a
corrente comercial.
As duas opções de acesso a tabelas são:
• Tabelas Auxiliares: módulo que contém as tabelas utilizadas pelo sistema.
• Situação dos arquivos: módulo que permite ao usuário consultar a situação dos arquivos
que solicitou geração.
As consultas podem ser filtradas e/ou combinadas por meio das variáveis "NCM", "Bloco
Econômico de Destino", "País de Destino", "UF", "Porto", "Via"e "Período". Para cada uma das
variáveis, estas são as seguintes opções de escolha:
Item Campo Alternativas
1 NCM Capítulo do SH - de dois dígitos
Posição do SH - quatro dígitos
Subposição do SH - seis dígitos
NCM - 8 (oito) dígitos
2 Bloco Econômico de Destino MERCOSUL, ALCA, outros...
3 País de Destino Todos que tenham comércioexterior
4 UF Todos os Estados brasileiros
5 Porto Todos os Portos brasileiros
6 Via Fluvial, aérea, outras...
7 Período de 1997 até a presente data
Tabela 9 – Opções das Variáveis
Fonte: O Autor
54
Após a realização das consultas desejadas, é necessário selecionar o tipo de arquivo que
será gerado: texto ou planilha eletrônica. Na sequência, o Sistema remete, via e-mail e em formato
compactado (WinZip), a tabela gerada. O e-mail que recebe o arquivo é aquele fornecido pelo
usuário no momento em que foi feito o cadastro. É possível ainda verificar um histórico com as
solicitações de arquivos no módulo Situação de Arquivos.
Etapa 02 - Pré-processamento e limpeza de dados
A geração das tabelas de consulta possui limitadores em relação à quantidade de períodos
ou mercadorias que podem ser executados em apenas uma consulta. Especificamente neste estudo,
foi necessária a consulta de todas as mercadorias dos capítulos 28, 29 e 30 da NCM. Esses três
capítulos possuem um total de 2229 mercadorias. Como a análise de dados foi relativa ao período
de janeiro de 2009 a dezembro de 2015, foram 84 (oitenta e quatro) meses consultados. Não há,
no sistema, a possibilidade de gerar uma tabela com todas as 2229 mercadorias separadas, com
seus respectivos meses de abrangência do estudo. Estas são as alternativas encontradas para o
recebimento dos dados desejados:
• Conforme Figura 18, gerar 2229 tabelas diferentes. Essa geração individual já vem com
os respectivos dados separados por mês e ano automaticamente, de janeiro de 1997 até a
presente data, o que facilita os trabalhos da fase de preparação dos dados, pois o formato
da tabela se aproxima a um formato padrão de séries temporais.
Figura 18 – Tabela recebida do ALICEWeb, consulta por único NCM
Apesar de facilitar algumas tarefas na fase de preparação dos dados, em função dos meses
e anos estarem nas linhas da tabela, tal opção é de difícil execução, pois necessita de
2229 consultas, gerando 2229 e-mails que teriam que ser abertos e suas respectivas tabelas
55
salvas. Teriam ainda que ser preenchidos, em toda consulta, os campos necessários, o que
demandaria muito tempo em todas as etapas.
• Conforme Figura 19, gerar 42 tabelas diferentes por meio da opção filtrar por NCM.
Uma característica dessa opção é que o sistema permite, no máximo, seis períodos por
consulta, assim, como o estudo terá um período de abrangência de 84 meses, foi necessária
a repetição da consulta por 14 vezes, para cada um dos três Capítulos, o que resultou em
42 consultas/tabelas. Como não há opção mais eficiente, optamos por essa solução.
Figura 19 – Tabela recebida do ALICEWeb, consulta por detalhamento de NCM
No entanto, apesar de ser mais rápida a fase de geração dessas tabelas no site, há prejuízos
na fase de preparação do dados, pois o formato das tabelas recebidas dificulta a análise dos dados.
As linhas são as NCM e as colunas são as séries temporais, o que torna impossível a análise dos
dados nesse formato. Foi necessária a conversão e o agrupamento de todas as colunas, linhas e
tabelas, o que será discutido na fase de pré-processamento.
O sistema ALICEWeb fornece relatórios ou tabelas individuais classificados por NCM.
O sistema não fornece, de forma direta, bases de dados que possam ser analisadas com o viés
do KDD, procurando por padrões e outras características que uma análise dessa possibilita.
Fornece, sim, tabelas, que têm que ser agrupadas por meio de construção de procedimentos
automatizados, o que permite a formação de um banco de dados para tais análises. Todo esse
processo de obtenção das tabelas poderia ser resolvido por um simples comando de filtro de banco
de dados. Isso geraria apenas um arquivo com as características necessárias para a pesquisa. No
entanto, essa opção não existe, o que torna as pesquisas de abrangência maior, como a presente,
mais custosas, principalmente em termos de tempo gasto na aquisição dos dados.
56
I Fase Renomear Tabelas com o padrão capXXYYZZAAAA
Após o recebimento dos 42 e-mails, foi necessário salvar as 42 tabelas que estão em anexo.
Essas tabelas possuem, originalmente, nomes aleatórios como "aliceweb20160502100536889.xls"e
"aliceweb20160428044934821.xls", o que dificulta a identificação de qual capítulo e período a
tabela corresponde. Para melhor identificação e também para facilitar o processo de agrupamento
de todas as tabelas em um único banco de dados, foi adotado o seguinte padrão para nomeação
das tabelas: "capXXYYZZAAAA", em que:
• XX é o número do capítulo
• YY é o mês inicial
• ZZ é o mês final
• AAAA é o ano
Como é permitida a consulta por um período máximo de seis meses, cada ano foi separado
em duas tabelas, ou seja, são necessárias duas tabelas para formar um ano. Como exemplo,
a tabela "cap2801062009.xls" corresponde aos seis primeiros meses do Capítulo 28 do ano de
2009 teríamos que fundir com a tabela "cap2807122009.xls", que corresponde aos seis últimos
meses do Capítulo 28 do ano de 2009. Como a presente pesquisa é referente a dados de sete anos
(2009-2015), multiplicado por 02 tabelas (são semestrais), resulta em um total de 14 tabelas.
Como são três capítulos (28,29 e 30), esses três são multiplicados por 14 tabelas (semestres), que
resultam nas 42 tabelas necessárias para formar o banco de dados. Tal padronização proporciou
uma maior agilidade nas fases de seleção, limpeza e agrupamento dos dados.
Conforme a Figura 19, as tabelas geradas no ALICEWeb possuem três variáveis para
cada NCM, que são:
• US - Valor em Dólar da mercadoria;
• Kg Líquido - Total de Quilos da mercadoria;
• Qtd - Quantida da mercadoria.
Nesta etapa foi descartada ou eliminada a variável Quantidade (Qtd), dado o caráter
de não continuidade dela, aparecendo em apenas alguns meses e em alguns anos. O sistema
fornece outras variáveis, como "Bloco Econômico de Destino", "País de Destino", "UF", "Porto"e
"Via", no entanto, no presente estudo, tais variáveis não têm importância e, portanto, não foram
selecionadas nas consultas.
II Fase Retirar Cabeçalho
As 42 tabelas geradas possuem cabeçalhos, os quais foram retirados. A retirada do
cabeçalho das tabelas foi feita por meio de procedimentos automatizados, por meio do pacote R.
57
III Fase Listar a Quantidade de Mercadorias das N Tabelas
Foi feita uma análise de todas as mercadorias geradas para os capítulos 28, 29 e 30.
A princípio, todas as tabelas de cada capítulo deveriam ter a mesma quantidade de regis-
tros/mercadorias, pois uma mercadoria presente em uma tabela deveria estar presente nas outras
tabelas do mesmo capítulo. Uma mercadoria que não está em uma das tabelas significa que, no
primeiro ou no segundo semestre, não houve transações comerciais ou foi um erro do sistema
ALICEWeb. Em uma consulta para um único Capítulo nos anos de 2009 a 2015, foram geradas
as seguintes quantidades de registros por Capítulo:
Capítulos Quantidade Registros/Mercadorias
28 458
29 1465
30 3
TOTAL 2229
Tabela 10 – Capítulos e suas quantidades de mercadorias
IV Fase Comparar Tabelas com Totais do Capítulo
Assim, em tese, qualquer outra consulta por período qualquer para os Capítulos 28, 29 e
30 deveria apresentar, respectivamente, as mesmas quantidades de Registros/Mercadorias que
constam na Tabela 10. No entanto, foi identificado que as quantidades de Registros/Mercadorias
das 42 tabelas geradas não coincidem com a Tabela 10, o que pode ser comprovado pela Tabela 11.
Na Tabela 11, a coluna "Mercadorias Originais" apresenta o quantitativo de Registro/Mercadoria
por tabela gerada, portanto, todas são diferentes, primeiro entre os semestres, e, segundo, em
relação à Tabela 10:
Capítulo Mercadorias Originais Mercadorias Corrigidas
1 cap2801062009 339 327
2 cap2807122009 344 327
3 cap2801062010 346 336
4 cap2807122010 347 336
5 cap2801062011 346 340
6 cap2807122011 347 340
7 cap2801062012 350 340
8 cap2807122012 355 340
9 cap2801062013 347 338
10 cap2807122013 345 338
11 cap2801062014 348 337
12 cap2807122014 354 337
13 cap2801062015 348 339
14 cap2807122015 355 339
15cap2901062009 1167 1116
16 cap2907122009 1183 1116
58
17 cap2901062010 1169 1114
18 cap2907122010 1177 1114
19 cap2901062011 1161 1106
20 cap2907122011 1181 1106
21 cap2901062012 1187 1110
22 cap2907122012 1162 1110
23 cap2901062013 1162 1092
24 cap2907122013 1161 1092
25 cap2901062014 1166 1102
26 cap2907122014 1176 1102
27 cap2901062015 1157 1108
28 cap2907122015 1176 1108
29 cap3001062009 215 196
30 cap3007122009 210 196
31 cap3001062010 209 194
32 cap3007122010 207 194
33 cap3001062011 207 193
34 cap3007122011 206 193
35 cap3001062012 209 190
36 cap3007122012 208 190
37 cap3001062013 211 185
38 cap3007122013 196 185
39 cap3001062014 205 187
40 cap3007122014 203 187
41 cap3001062015 205 186
42 cap3007122015 205 186
Tabela 11 – Tabelas Semestrais
Etapa 03 - Transformação dos dados
Esta etapa é composta por quatro subetapas, em que foi focada a transformação dos
dados anuais de cada um dos capítulos para apenas um banco de dados preparado para a análise
dos dados.
I Fase Intersecção de Tabelas do Mesmo Ano
Para a solução da diferença entre os semestres, optou-se por verificar qual a intersecção
das duas tabelas, do primeiro e do segundo semestre, manter as mercadorias que eram comuns
às duas; as mercadorias que não eram em comum foram eliminadas e separadas em uma tabela
de resíduo. Assim, vamos adotar como referência as tabelas "cap2801062009" e "cap2807122009",
59
que estão nas duas primeiras linhas da Tabela 11. A coluna "Mercadorias Originais" exibe as
quantidades originais geradas pelo ALICEWeb, as quais são 339 e 344 mercadorias para o primeiro
e segundo semestres, respectivamente. Não há como fazer a junção das duas tabelas com essa
diferença de mercadorias. Assim, foram eliminadas 12 mercadorias em "cap2801062009" e na
tabela "cap2807122009" , foram eliminados 17 registros, conforme Figura 20 (página 60):
Figura 20 – Diagrama de Intersecção das tabelas cap2801062009 e cap2807122009
Como podemos observar por meio da Tabela 11, a coluna "Mercadorias Corrigidas"
possui a quantidade de registros que são comuns às duas tabelas, do primeiro e do segundo
semestre, o que torna possível a futura junção das duas. Isso é possível em função de serem
idênticas na quantidade de meses (seis) e de registros (327). Consequentemente, os resíduos
do "cap2801062009.xls" são 12 mercadorias e do "cap2807122009.xls" são 17 mercadorias. Essa
operação foi repetida para todos os pares de tabelas, do primeiro e do segundo semestres, de
cada ano, o que pode ser observado nas linhas subsequentes da Tabela 11, coluna "Mercadorias
Corrigidas".
É possível notar que, primeiramente, foram eliminadas 29 (17+12) mercadorias que não
constavam em uma das tabelas, ou seja, 29 mercadorias que não poderão ser analisadas. Isso,
considerando apenas as duas primeiras tabelas. É possível notar também que, da consulta original,
de 458 mercadorias que constam no Capítulo 28, conforme Tabela 10, restaram 327 mercadorias
após a intersecção das duas tabelas. Isso representa uma diferença de 131 mercadorias, que
também não serão analisadas. Além das duas tabelas citadas anteriormente, temos que ter o
mesmo raciocínio e procedimentos para as outras 40 tabelas que formam a pesquisa.
A próxima etapa foi a junção das tabelas semestrais, formando uma única tabela anual.
Como as tabelas semestrais possuem a mesma quantidade de mercadorias, o procedimento
é passível de realização. A junção das duas tabelas semestrais gera a repetição de algumas
colunas, como o "Código da Mercadoria", por exemplo, que é comum às duas tabelas. A rotina
desenvolvida para esse fim teve a finalidade de executar a junção e ainda eliminar as colunas
repetidas. Para melhor identificação e ainda para facilitar o processo de agrupamento de todas as
tabelas em um único banco de dados, foi adotado o seguinte padrão para nomeação das tabelas:
"capANUALXXYYYY", em que XX é o número do Capítulo e YYYY é o ano. A Tabela 12
apresenta as 21 tabelas anuais resultante:
60
Capítulo Mercadorias
1 capANUAL282009 327
2 capANUAL282010 336
3 capANUAL282011 340
4 capANUAL282012 340
5 capANUAL282013 338
6 capANUAL282014 337
7 capANUAL282015 339
8 capANUAL292009 1116
9 capANUAL292010 1114
10 capANUAL292011 1106
11 capANUAL292012 1110
12 capANUAL292013 1092
13 capANUAL292014 1102
14 capANUAL292015 1108
15 capANUAL302009 196
16 capANUAL302010 194
17 capANUAL302011 193
18 capANUAL302012 190
19 capANUAL302013 185
20 capANUAL302014 187
21 capANUAL302015 186
Tabela 12 – Tabelas Anuais
II Fase Intersecção de Tabelas de Anos Diferentes
Como observado na Tabela 12, as tabelas anuais correspondentes a cada capítulo não
possuem a mesma quantidade de mercadoria, o que impossibilita a junção com a finalidade de
formar apenas uma tabela contendo os 7 anos de abrangência da pesquisa. Como ocorreu nas
tabelas semestrais, Tabela 10, optou-se por verificar qual a intersecção das sete tabelas (anuais)
e, a partir das mercadorias que fossem comum às duas, mantê-las em cada uma das tabelas. As
que não eram em comum foram eliminadas e separadas em uma tabela de resíduo. Dessa forma,
foi feita a concatenação das tabelas, conforme Tabela 13.
61
Tabelas Quantidade Registros/Mercadorias
1 cap28 295
2 cap29 915
3 cap30 153
TOTAL 1363
Tabela 13 – Tabelas de 2009 a 2015
Por fim, foi feita a união dos três Capítulos em apenas um arquivo, respeitando os NCM
e seus respectivos meses/anos, formando apenas um banco de dados, o que proporcionará a
viabilidade para a análise dos dados, com 1363 Mercadorias. Se considerarmos a Tabela 10 com
2229 mercadorias, concluímos que foram eliminadas 866 mercadorias, que não foram passíveis de
análise no presente estudo.
III Fase Formatação dos Campos
Na formatação do banco de dados, a principal tarefa é a conversão dos valores numéricos.
O formato produzido pelo sistema ALICEWeb não é compatível com o pacote R. Como solução,
foram retirados todos os pontos que constam das numerações, transformando valor em dólar de
1.123.664,00 para o formato simples de 1123664,00. O Período, representado por mm/aaaa, foi
separado em dois campos: um para o mês "mm"e outro para o ano "aaaa".
subsubsectionFase Transformação em Séries Temporais
Como última tarefa da construção do banco de dados, as colunas foram convertidas em
linhas e vice-versa. Isso é necessário para poder analisar os dados por meio de séries temporais.
Como resultado final, o banco de dados ficou com o formato apresentado na Figura 21:
Figura 21 – Formato final do Banco de Dados
O banco de dados possui 231.710 elementos (1363 mercadorias x 170 variáveis). O Pacote
R considera o banco de dados Large matrix, com tamanho de 7.8 Megabytes.
Etapa 04 - Mineração de Dados
Nessa fase, são selecionadas e aplicadas várias técnicas de modelagem e quais são os
parâmetros dos modelos. Existem várias técnicas para o mesmo tipo de problema de mineração
de dados. Todas as técnicas empregadas nessa fase serão executadas dentro do software R.
62
Foram utilizadas várias técnicas de modelagem. A princípio, empregou-se a estatística
descritiva para a comparação entre os capítulos do NCM. Na sequência, foram separados os três
capítulos que são de interesse e, para cada capítulo, foram realizadas as seguintes técnicas:
• Análise de séries temporais com linha de tendência;
• Estudo de correlação entre as variáveis Dólar e Kg das mercadorias;
• Classificação das correlações das mercadorias;
• Frequência relativa das correlações;
• Relação das mercadorias cujas variáveis Dólar e Kg possuem correlações baixas ou negativas;
• Previsão para gastos em dólar por meio de treino e teste dos dados.
Nessa fase, foram comparados todos os resultados e avaliados se foram encontrados os
melhores modelos. Assim, foram considerados os modelos que resultaram na criação de novos
conhecimentos e que contribuíram para a gestão em saúde.
Etapa 05 - Análise e interpretação das informações do sistema ALICEWEB
A criação do conhecimento foi realizada utilizando-se de métodos e de modelos estatísticos,
analisando o comportamento dosdados passados e realizando projeções para o futuro em relação
ao Sistema ALICEWeb. O banco de dados constituído no presente estudo forma um conjunto de
observações ordenadas no tempo. Esse tempo refere-se ao período de 2009 a 2015, e o objetivo é
analisar o comportamento das seguintes variáveis:
• US$ - Valor em Dólar da mercadoria
• Kg Líquido - Total de quilogramas da mercadoria
Como abordagem inicial, vamos considerar os gastos em dólares, referentes a importações
de fármacos, no referido período. A Figura 22 apresenta o gasto percentual correspondente a
cada Capítulo:
Figura 22 – Porcentagem Gastos em Dólar por Capítulo (2009-2015)
Capítulo 28 − 12 %
Capítulo 29 − 51 %
Capítulo 30 − 37 %
63
Observa-se que há uma concentração nas importações referentes às mercadorias do
Capítulo 29, o qual corresponde a cerca de 51% do total de fármacos importados pelo país. Já o
Capítulo 30 corresponde a 12% dos valores importados pelo Brasil. O Gráfico 22 refere-se a um
gasto total de US$ 117.391.232.742,00 (aproximadamente 117 bilhões de dólares) no período.
Com o objetivo de aprofundar os estudos, fez-se um corte por capítulo do NCM, o
que possibilitou observar o comportamento das importações e suas características peculiares
ordenadas no tempo. Assim, nas próximas subseções, ir-se-á discorrer sobre cada um dos três
capítulos, procurando por padrões, por associações e ainda por novos conhecimentos que possam
ser extraídos da base de dados.
I Capítulo 28 do NCM - Produtos químicos inorgânicos, compostos inorgânicos ou orgâ-
nicos de metais preciosos, de elementos radioativos, de metais das terras raras ou de
isótopos
A Figura 23 representa o comportamento das importações das mercadorias referentes ao
Capítulo 28 no período de 2009 à 2015:
Figura 23 – Comparativo de gastos em Dólar e Kg importados (2009-2015) do Capítulo 28
2009 2010 2011 2012 2013 2014 2015 2016
12
0
14
0
16
0
18
0
20
0
22
0
12
0
14
0
16
0
18
0
20
0
22
0
M
ilh
õe
s 
de
 D
ól
ar
es
35
0
40
0
45
0
50
0
55
0
60
0
 M
ilh
õe
s 
de
 K
g
Período 
DOLAR
Kg
Tendência Dólar
Tendência Kg
O gráfico possui dois eixos. O esquerdo, referente aos gastos em milhões de dólares, e o
direito, referente às importações em milhões de quilogramas (Kg). Possui, ainda, linhas de cores
preta e azul, que representam, respectivamente, o comportamento dos gastos em dólares e as
quantidades em kg ao longo do período. Além dessas características, possui também duas linhas
de tendência, a de cor vermelha, que representa a tendência dos gastos em dólares, e a de cor
branca, que representa a tendência dos Kg.
É possível notar que não há identificação de fatores sazonais, haja vista que a série
temporal não possui um padrão, ou comportamento, que possa ser atribuído a um período, ou
64
a um fator sazional. Quanto aos ciclos apresentados, observa-se que há um ciclo de alta, tanto
nos dólares gastos quanto nos Kg, no período de 2009 a 2012. Já de 2013 a 2014, identifica-se
um ciclo de estabilização, principalmente nos Kg. A partir de 2014, começa um ciclo de queda
em ambas as observações, o que segue até o final de 2015. Observa-se, ainda, que a série é não
estacionária, pois há mudança de tendência e comportamento em diferentes momentos.
Primeiramente, com o objetivo de analisar a relação entre as variáveis Quilograma e
Dólar, foi construído um diagrama de dispersão, conforme Figura 24:
Figura 24 – Gráfico de correlação de Dólar versus Kg importados (2009-2015) do Capítulo 28
350000000 400000000 450000000 500000000 550000000 600000000
12
00
00
00
0
16
00
00
00
0
20
00
00
00
0
Dólar
K
g 
Dólar
Kg
Analisando o padrão global dos pontos grafados no diagrama, observam-se as seguintes
características dos dados:
• Não há outliers;
• Há um padrão de direção, mais precisamente, uma direção para cima;
• Esse padrão sugere uma relação positiva, ou seja, quanto mais se gasta em dólar, mais
quilogramas de mercadoria chegam ao país.
No confronto entre as duas variáveis, foi detectada uma correlação positiva de 0.755,
conforme tabela a seguir.
t df p-value
Estimativas 10.443 82 < 0.000000000000000
95% Intervalo confiança: 0.6457149 a 0.83470
Correlação Linear: 0.7555176
Tabela 14 – Correlação do produto de momento de Pearson (Dados: Dólar vs Kg)
Com 84 pares de dados (7 anos x 12 meses = 84), e supondo que não há nenhuma relação
entre x (Dólar) e y (Kg), o valor crítico para α = 0,05 é de 0,220, ou seja, há uma chance de 5%
65
de que o valor absoluto do coeficiente de correlação linear (r) exceda 0,220. Assim, dado que o
r calculado foi de 0.755, ultrapassando o valor crítico, concluí-se que há uma forte correlação
linear entre Dólar e Kg (TRIOLA, 2008). Mais precisamente, essa correlação não é fruto do
acaso, por ter ultrapassado o valor crítico.
A análise visual do diagrama e o cálculo do coeficiente de correlação linear apenas sugerem
algumas questões. Com o objetivo de explicitar a forma dessa relação, é necessário calcular as
estatísticas descritivas dos resíduos e outros para melhor entendimento da dependência entre as
variáveis. Esses cálculos são necessários para avaliar a real relação entre as variáveis estudadas.
Assim, segue tabela com os cálculos e as variáveis que formam a equação de regressão:
Dólar vs Kg (em milhões)
Residuais:
Min 1Q Median 3Q Max
-97512268 -37585718 -2395161 34460354 807919
Coeficientes:
Estimado Erro Padrão t valor Pr(>|t|)e
(Intercepto) 195.020.385,85 28490545.9994 6.845 0.0000001
Dólar 1.743 0.167 10.444 <0.000000000
Erro padrão Residual: 19.49 em 82 graus de liberdade
R2: 0.5709, R2 ajustado: 0.5656
F-statistic: 109.1 em 1 e 82 DF, valor-p: < 0.00000000000000022
Tabela 15 – Resumo correlação do produto de momento de Pearson (Dados: Dólar vs Kg)
Interpretando a Tabela 15, o intercepto β0 é igual 195.020.385, 85, ou seja, o valor previsto
de y, ou dos Quilogramas, quando o dólar, ou x, for igual a zero. Já a inclinação, ou β1, é igual a
1.743. Isso quer dizer que, para cada dólar extra gasto, vai aumentar, em média, 1, 743 quilos de
medicamentos do Capítulo 28, formando a equação de regressão:
Kg = 195020385.856 + 1.743 ∗ dólar
Tal equação tem por objetivo prever, ou estimar, o quanto de quilogramas de mercadorias
do Capítulo 28 alcançaria, em função de valores gastos em dólares. No entanto, por não se
tratar de um modelo matemático exato, e sim de um modelo estatístico que melhor se ajusta
aos pontos (BRUNI, 2012), é necessário levar em consideração outras variáveis presentes na
Tabela 15. Primeiramente, observamos que o valor-p é menor que 0,05, ou seja, demonstra que a
associação entre Kg e Dólar é significativa. Verificamos também que o R2 tem o valor de 0.5709,
ou seja, que a equação responde por 57.09% da relação múltipla. Há também o erro padrão
residual, isto é, quanta variação eles exibem e os graus de liberdade.
A correlação apresentada diz respeito aos gastos em dólares versus Quilogramas, a partir
da somatória mensal de todas as mercadorias do Capítulo 28. No entanto, como a base de dados
do Capítulo 28 é formada por 295 mercadorias, pode ocorrer de algumas mercadorias não terem
essa mesma relação entre dólares versus Quilogramas, podendo ter uma variação para mais ou
para menos. Assim, visando detalhar o estudo, foi analisada a relação Dólares versus Quilogramas
de cada mercadoria, produzindo o histograma de distribuição de correlação por mercadoria
apresentado na Figura 25:
66
Figura 25 – Histograma de Distribuição de Correlações das Mercadorias do Capítulo 28
Correlação de −1 a +1
F
re
qu
ên
ci
a
0.0 0.2 0.4 0.6 0.8 1.0
0
50
10
0
15
0
20
0
25
0
30
0
Das 295 correlações Dólares versus Quilogramas analisadas, nota-se que há uma acentuada
quantidade de índice de correlação situada entre 0.8 e 1. Para facilitar a análise, o histograma da
Figura 25 foi representado por meio da tabela de frequência relativa de correlações, exibida na
Tabela 16:
Fatores Freq. Acúmulo.frequência Percentual Acúmulo.Percentual
1 (-0.0977,0.013] 2 2 0.677 0.6772 (0.013,0.123] 2 4 0.677 1.355
3 (0.123,0.232] 3 7 1.016 2.372
4 (0.232,0.342] 9 16 3.050 5.423
5 (0.342,0.451] 10 26 3.389 8.813
6 (0.451,0.561] 11 37 3.728 12.54
7 (0.561,0.671] 14 51 4.745 17.28
8 (0.671,0.78] 25 76 8.474 25.76
9 (0.78,0.89] 45 121 15.25 41.01
10 (0.89,1] 174 295 58.98 100
Tabela 16 – Frequência Relativa das Correlações do Capítulo 28
Observando a Tabela 16, na coluna "Fatores", a maior parte das mercadorias, especifi-
camente 244 (82,71% do total), possui significante correlação: entre 0,671 e 1. Tal constatação
indica uma forte correlação entre Dólares versus Quilogramas, ou seja, quanto mais se gasta
em dólar, mais quilogramas de mercadorias do capítulo 28 chegam ao país. No entanto, há 37
mercadorias que possuem uma correlação considerada baixa, não indicando essa tendência de se
gastar mais e, consequentemente, receber mais mercadorias. Essas 37 mercadorias (12,54% do
total) possuem uma correlação de US$ versus Kg entre -0.0977 e 0.561. Há, inclusive, mercadorias
que possuem correlação negativa, ou seja, quanto mais se gasta em dólar, menos Kg de mercadoria
são entregues. Essas mercadorias com baixa correlação estão relacionadas no Apêndice III.
Essas 37 mercadorias representaram um gasto total, no período de 2009 a 2015, de 502
67
milhões de dólares. A mercadoria "Hipocloritos de sódio" foi a mercadoria que obteve o maior
gasto e que possui correlação de 0.1634. Já a segunda mercadoria de maior gasto foi o "Molibdênio
99 absorvido em alumina apto para a obtenção de Tecnécio 99 (reativo de diagnóstico para
medicina nuclear)", cuja correlação foi negativa de -0.005. Procurando interpretar melhor o
comportamento das duas mercadorias citadas anteriormente, foram construídos os gráficos de
importação destas.
A Figura 26 representa o comportamento das importações da mercadoria "Hipocloritos
de Sódio", no período de 2009 a 2015:
Figura 26 – Comparativo de gastos em Dólar e Kg importados (2009-2015) da Mercadoria
Hipocloritos de Sódio
2009 2010 2011 2012 2013 2014 2015 2016
0
10
00
20
00
30
00
40
00
0
D
ól
ar
0
58
17
5
36
0
47
8
70
5
 K
g
Período 
Dólar
Kg
Tendência Dólar
Tendência Kg
A Figura 26 possui dois eixos, o esquerdo, referente aos gastos em milhões de dólares, e o
direito, referente às importações em milhões de quilogramas (Kg). Possui, ainda, linhas de cores
preta e azul, que representam, respectivamente, o comportamento dos gastos em dólares e as
quantidades em quilogramas ao longo do período. Além dessas características, possui também
duas linhas de tendência, a de cor vermelha, que representa a tendência dos gastos em dólares, e
a branca, que representa a tendência dos Kg.
Já a Figura 27 representa o comportamento das importações da mercadoria "Molibdênio
99 absorvido em alumina apto para a obtenção de Tecnécio 99", no período de 2009 a 2015:
68
Figura 27 – Comparativo de gastos em Dólar e Kg importados (2009-2015) da Mercadoria
Molibdênio 99 absorvido em alumina apto para a obtenção de Tecnécio 99
2009 2010 2011 2012 2013 2014 2015 2016
20
00
00
60
00
00
10
00
00
0
14
00
00
0
D
ól
ar
0
1
 K
g
Período 
Kg
Dólar
Tendência Dólar
Tendência Kg
A Figura 27 possui dois eixos, o esquerdo, referente aos gastos em milhões de dólares, e o
direito, referente às importações em milhões de quilogramas (Kg). Possui, ainda, linhas de cor
preta e azul, que representam, respectivamente, o comportamento dos gastos em dólares e as
quantidades em quilogramas ao longo do período. Além dessas características, possui também
duas linhas de tendência, a de cor vermelha, que representa a tendência dos gastos em dólares, e
a de cor branca, que representa a tendência dos Kg.
Analisando a Figura 26, fica claro que não há um padrão ou uma correlação entre gastos
em Dólar e Kg importados. Há períodos em que aumentam-se os gastos em dólares e diminuem-se
a quantidade de mercadoria, É possível notar que o contrário também acontece. Assim, não
há padrão de relação entre as duas variáveis, o que justifica a correlação de apenas 0.1634. Já
na figura 27, correspondente à mercadoria "Molibdênio 99...", cuja correlação foi negativa de
-0.005, observa-se o fenômeno de aumento dos gastos em dólares e o não atingimento de nenhum
quilograma de mercadoria.
Para finalizar, listamos, no Apêndice IV, as principais mercadorias com baixa correlação
e suas respectivas finalidades e aplicações.
II Capítulo 29 do NCM - Produtos Químicos Orgânicos
Assim como o Capítulo 28, o Capítulo 29 também possui "constituição química definida",
ou seja, o produto químico deverá ter fórmula química, diferentemente do que ocorre nos Capítulos
30 a 40, que é seção das preparações químicas e dos polímeros (DALSTON, 2016). O Capítulo 29
do NCM responde por cerca de 51% do total de fármacos importados pelo país, ou seja, dentre os
três analisados no presente estudo, é o Capítulo de maior volume de gastos em Dólar no período
estudado.
69
A Figura 28 (página 70) representa o comportamento das importações das mercadorias
referentes ao Capítulo 29 no período de 2009 a 2015:
Figura 28 – Comparativo de gastos em Dólar e Kg importados (2009-2015) do Capítulo 29
2009 2010 2011 2012 2013 2014 2015 2016
40
0
50
0
60
0
70
0
80
0
90
0
10
00
40
0
50
0
60
0
70
0
80
0
90
0
10
00
M
ilh
õe
s 
de
 D
ól
ar
15
0
20
0
25
0
30
0
35
0
 M
ilh
õe
s 
de
 K
g
Período 
Kg
Dólar
Tendência Dólar
Tendência Kg
A Figura 28 possui dois eixos, o esquerdo, que refere-se aos gastos em milhões de dólares,
e o direito, que refere-se às importações em milhões de quilogramas (Kg). Possui, ainda, linhas
de cor preta e azul, que representam, respectivamente, o comportamento dos gastos em dólares e
as quantidades em quilogramas ao longo do período. Além dessas características, possui também
duas linhas de tendência, a de cor vermelha, que representa a tendência dos gastos em dólares, e
a de cor branca, que representa a tendência dos Kg.
Observando a Figura 28 (página 70), identifica-se que há uma tendência de alta até o
ano de 2014. De 2014 a 2015, o comportamento das variáveis tende a cair, tanto os gastos em
Dólar quanto os quilogramas importados. Calculando a correlação entre os gastos em Dólar por
quilogramas, referentes às mercadorias do Capítulo 29, há uma correlação positiva de 0.68527.
Assim como no Capítulo 28, há uma significante correlação entre ambos, ou seja, quando se gasta
mais em dólares, consequentemente, chegam mais quilogramas de mercadorias. Visando detalhar
o estudo, foi analisada a relação US$ versus Kg de cada uma das mercadorias que compõem o
capítulo 29, totalizando 915 mercadorias, o que resultou no seguinte histograma de distribuição
de correlação, apresentado na Figura 29 (página 71).
Das 913 correlação US$ versus Kg analisadas, nota-se que há uma acentuada quantidade
de índice de correlação situada entre 0.8 e 1. Para facilitar a análise, o histograma acima foi
representado por meio da tabela de frequência relativa de correlações, apresentadas na Tabela 17
(página 71).
Observando a Tabela 17, a seguir, na coluna "Fatores", a maior parte das mercadorias,
especificamente 810 (88,71% do total), possui significante correlação: entre 0,582 e 1. Tal
constatação indica uma forte correlação entre US$ versus Kg, ou seja, quanto mais se gasta
em dólar, mais quilogramas de mercadorias do Capítulo 29 chegam ao país. No entanto, há
70
Figura 29 – Histograma de Distribuição de Correlações das Mercadorias do Capítulo 29
Correlação de −1 a +1
F
re
qu
ên
ci
a
0.0 0.2 0.4 0.6 0.8 1.0
0
10
0
20
0
30
0
40
0
50
0
Fatores Freq Acumulo.frequencia Percentual Acumulo.Percentual
1 (-0.0461,0.0594] 5 5 0.547 0.547
2 (0.0594,0.164] 14 19 1.533 2.081
3 (0.164,0.268] 19 38 2.081 4.162
4 (0.268,0.373] 16 54 1.752 5.914
5 (0.373,0.477] 21 75 2.300 8.214
6 (0.477,0.582] 28 103 3.066 11.28
7 (0.582,0.686] 42 145 4.600 15.88
8 (0.686,0.791] 67 212 7.338 23.22
9 (0.791,0.895] 137 349 15.00 38.22
10 (0.895,1] 564 913 61.77 100
Tabela 17 – Frequência Relativa das correlações doCapítulo 29
103 mercadorias que possuem uma correlação considerada não significativa, não indicando
essa tendência de se gastar mais e, consequentemente, receber mais mercadorias. Essas 103
mercadorias (11,29% do total), possuem uma correlação de US$ versus Kg entre -0.045 e 0.5811.
Essas mercadorias com baixa correlação estão relacionadas na Tabela presente no Apêncide V.
Para finalizar, listamos, na Tabela 25, as mercadorias que não possuem correlação
significativa e suas respectivas finalidades no Apêndice VI.
III Capítulo 30 do NCM - Produtos farmacêuticos
A Figura 30 representa o comportamento das importações das mercadorias referentes ao
Capítulo 30 no período de 2009 e 2015:
A Figura 30 possui dois eixos, o esquerdo, que refere-se aos gastos em milhões de dólares,
e o direito, que refere-se às importações em milhões de quilogramas (Kg). Possui, ainda, linhas
de cor preta e azul, que representam, respectivamente, o comportamento dos gastos em dólares e
71
Figura 30 – Comparativo de gastos em Dólar e Kg importados (2009-2015) do Capítulo 30
2009 2010 2011 2012 2013 2014 2015 2016
30
0
40
0
50
0
60
0
70
0
30
0
40
0
50
0
60
0
70
0
M
ilh
õe
s 
de
 D
ól
ar
2
3
4
5
 M
ilh
õe
s 
de
 K
g
Período 
Kg
Dólar
Tendência Dólar
Tendência Kg
as quantidades em quilogramas ao longo do período. Além dessas características, possui também
duas linhas de tendência, a de cor vermelha, que representa a tendência dos gastos em dólares, e
a de cor branca, que representa a tendência dos Kg.
É possível notarna Figura 30, que há uma tendência de alta dos quilogramas em todo o
período e uma leve tendência de baixa dos gastos em dólar a partir do meio de 2014. Calculando
a correlação entre os gastos em dólar por quilogramas, referentes às mercadorias do Capítulo 30,
há uma correlação positiva de 0.6354. Assim como nos Capítulos 28 e 29, há uma significante
correlação entre ambos, ou seja, quando se gasta mais em dólares, consequentemente, chegam
mais quilogramas de mercadorias. Visando a detalhar o estudo, foi analisada a relação US$ versus
Kg de cada uma das mercadorias que compõem o Capítulo 30, totalizando 152 mercadorias, o
que resultou no seguinte histograma de distribuição de correlação, apresentado na Figura 31
(página 73):
É possível notar na Figura 31, que das 152 correlações US$ versus Kg analisadas, há uma
acentuada quantidade de índice de correlação situada entre 0.6 e 1. Para facilitar a análise, o
histograma da Figura 31 foi representado por meio da tabela de frequência relativa de correlações,
exibida na Tabela 18:
72
Figura 31 – Histograma de Distribuição de Correlações das Mercadorias do Capítulo 30
Correlação de −1 a +1
F
re
qu
ên
ci
a
−0.2 0.0 0.2 0.4 0.6 0.8 1.0
0
5
10
15
20
25
30
35
Fatores Freq. Acúmulo.frequência Percentual Acúmulo.Percentual
1 (-0.217,-0.0949] 1 1 0.657 0.657
2 (-0.0949,0.026] 2 3 1.315 1.973
3 (0.026,0.147] 3 6 1.973 3.947
4 (0.147,0.268] 3 9 1.973 5.921
5 (0.268,0.389] 12 21 7.894 13.81
6 (0.389,0.51] 16 37 10.52 24.34
7 (0.51,0.631] 13 50 8.552 32.89
8 (0.631,0.752] 24 74 15.78 48.68
9 (0.752,0.873] 27 101 17.76 66.44
10 (0.873,0.995] 51 152 33.55 100
Tabela 18 – Frequência Relativa das Correlações do Capítulo 30
É possível notar que na coluna "Fatores"da Tabela 18, a maior parte das mercadorias,
especificamente 115 (75,65% do total), possui significante correlação: de 0,51 e 1. Tal constatação
indica uma forte correlação entre US$ versus Kg, ou seja, quanto mais se gasta em dólar, mais
quilogramas de mercadorias do Capítulo 30 chegam ao país. No entanto, há 37 mercadorias que
possuem uma correlação considerada não significativa, não indicando essa tendência de se gastar
mais e, consequentemente, receber mais mercadorias. Essas 37 mercadorias, ou 24,34% do total,
possuem uma correlação de US$ versus Kg entre -0.217 e 0.51. Essas mercadorias com baixa
correlação estão relacionadas no Apêndice VII.
Para finalizar, listamos, no Apêndice VIII, as mercadorias que não possuem correlação
significativa e suas respectivas finalidades e aplicações.
73
IV Previsões para o Capítulo 28
O objetivo nesta seção é realizar previsões em relação ao comportamento futuro do
Capítulo 28 do NCM, de nomenclatura "Produtos químicos inorgânicos, compostos inorgânicos
ou orgânicos de metais preciosos, de elementos radioativos, de metais das terras raras ou de
isótopos", mais precisamente a previsão das variáveis Dólar e Kg. As projeções serão realizadas por
meio da construção de um modelo estatístico que se adapte às características das séries em estudo.
Para tal propósito, foi analisado se as séries temporais possuem as seguintes características:
tendência, sazonalidade, ciclos e estacionariedade. Conforme Seção I, após a observação exclusiva
da Figura 23, podemos sugerir que a série temporal possui algumas dessas características, no
entanto, são necessários testes formais e observações mais detalhadas para a comprovação de tais
evidências.
Primeiramente, foi feito o teste Augmented Dickey-Fuller (ADF) para as séries temporais
das duas variáveis, com o objetivo de determinar se há ou não estacionariedade. Para a variável
Dólar, foram calculados os seguintes valores:
Augmented Dickey-Fuller Test
Dickey-Fuller = -0.4711, Lag order = 4, p-value = 0.981
alternative hypothesis: stationary
Tabela 19 – Teste de estacionariedade Dólar
Para a variável Kg, foram calculados os seguintes valores:
Augmented Dickey-Fuller Test
Dickey-Fuller = -1.2519, Lag order = 4, p-value = 0.883
alternative hypothesis: stationary
Tabela 20 – Teste de estacionariedade Kg
Como os testes deram um elevado p-valor, 0.981 e 0.883, para as séries temporais das
variáveis Dólar e Kg, respectivamente, concluímos que as duas séries são não estacionárias, ou
seja, o valor da série histórica muda em diferentes momentos.
Foi realizada também a identificação da presença de sazonalidade e tendência na série
temporal. Uma das formas de identificar tais características é por meio do gráfico de correlograma,
gráfico esse que mede a relação linear entre valores defasados de uma série temporal.
Os quatro gráficos anteriores representam as quatro possibilidades de combinação da
série temporal em estudo. O eixo x de cada um dos gráficos, ou defasamentos (lag), representa o
intervalo da série temporal. Por exemplo, lag1 mede a relação entre yt e yt−1, lag2 mede a relação
entre yt e yt−2, e assim por diante. Como não há formas de lag que se repetem em períodos de
tempo, demonstra-se que não há correlações entre os lag dentro da própria série temporal, logo,
não foi identificada a sazonalidade na série. No entanto, fica evidente a tendência de queda, em
ambos os gráficos, de Kg e Dólar, o que justifica a ocorrência de tendência na série temporal.
Para ratificar a análise de sazonalidade, apresenta-se o gráfico das variáveis Dólar e Kg,
74
por meio da Figra 32 (página 75).
Figura 32 – Gráfico de sazonalidade das variáveis Dólar e Kg do Capítulo 28
12
0
14
0
16
0
18
0
20
0
22
0
2009
2010
20112012
20132014
2015
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
 M
ilh
õe
s 
de
 D
ól
ar
es
 Meses
35
0
40
0
45
0
50
0
55
0
60
0
2009
201020112012
2013
2014
2015
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
 M
ilh
õe
s 
de
 K
g
 Meses
Obsevando os dois gráficos que formam a Figura 32, identifica-se que não há qualquer
padrão de sazonalidade. Para corroborar tal afirmação, é importante comparar a Figura 32
(página 75) com a Figura 13 (página 39), em que esta é um exemplo de gráfico cujos dados
possuem sazonalidade.
A partir da interpretação de que a série temporal é não estacionária, não possui sazonali-
dade, mas possui tendência, foi pesquisado o melhor modelo para realizar as previsões, levando-se
em consideração tais características. Apesar de constar cinco tipos de tendência na literatura, foi
identificada nas séries temporais do presente estudo a presença de tendência aditiva, justificada
pelo fato de que a variabilidade da tendência é discreta. Maisespecifimente, não há aumento,
nem diminuição, de forma acentuada e gradativa dos dados ao longo do tempo, o que evidencia a
não multiplicidade, e sim a tendência aditiva. Com a metodologia de separação dos dados em
75
duas partes, uma para treinamento e outra para teste, foram testados sete modelos de previsão,
conforme Figura 33 (página 76).
Figura 33 – Gráfico de teste de melhor método - Previsões para gasto em Dólar - Capítulo 28
Previsões para gasto em Dólar − Capítulo 28
2009 2010 2011 2012 2013 2014 2015 2016
12
00
00
00
0
16
00
00
00
0
20
00
00
00
0
Método Sazonal Naïve
Método da Média
Método Naïve
Método Holt Alpha
Método SES
Método da ETS (ANN)
Método ARIMA(1,1,1)
Dados de Teste
A linha tracejada representa os dados de teste, ou dos dados reais. Essa linha será
confrontada com as outras linhas, que representam os métodos de previsão. Em uma leitura
inicial do gráfico da Figura 33 (página 76), identifica-se que os métodos como o Naïve, da Média
e de Holt Alpha são lineares, ao contrário dos dados de teste, e ficaram em uma posição distante
em relação aos dados de teste. Isso indica um baixo desempenho em relação às previsões. Os
outros métodos se comportaram melhor, no entanto, apenas com a avaliação visual do gráfico,
corre-se o risco de realizar uma avaliação incorreta. Dessa maneira, procurando tornar a avaliação
mais objetiva, foi feita uma tabela com os erros de previsão para cada um dos métodos, conforme
Tabela 21 (página 76).
ME RMSE MAE MPE MAPE MASE tipo
7 7881795.86 30623184.78 24654116.05 3.57 14.15 1.00 SNaive
3 0.00 29843883.13 25084390.66 -3.49 16.00 1.02 Média
1 -463443.20 24019663.57 19964486.80 -1.38 12.14 0.81 Naive
6 1488962.70 21297242.69 17382690.47 0.39 10.56 0.71 Holt Alpha
5 721458.32 18971518.35 15632813.78 -0.61 9.43 0.63 SES
4 230843.18 18203326.08 14502063.43 -0.56 8.77 0.59 ETS(A,N,N)
2 -205145.50 17327973.94 14121535.85 -0.92 8.53 0.57 ARIMA(111)(001)
Tabela 21 – Métodos de Previsão para o Capítulo 28
Assim, analisando a Figura 33 e a Tabela 21, optou-se pelo método ARIMA(111)(001),
por possuir o menor MAPE e menor MASE para, dessa forma, possuir o menor erro de previsão
em relação aos dados de teste. A partir da escolha do método mais adequado, foi realizada a
previsão conforme a Figura 34 (página 77).
É possível notar na Figura 34, que as previsões são mostradas como uma linha azul, com
os intervalos de previsão de 80% como uma área sombreada de cinza escuro e os intervalos de
76
Figura 34 – Gráfico de previsão utilizando-se do modelo ARIMA para o Capítulo 28 - Dólar
Ano
D
ól
ar
es
2010 2012 2014 2016
10
00
00
00
0
15
00
00
00
0
20
00
00
00
0
predição de 95% como uma área sombreada em cinza claro.
V Previsões para o Capítulo 29
A partir da interpretação das características da série temporal, foi pesquisado o melhor
modelo para realizar as previsões, levando-se em consideração tais características. Com a meto-
dologia de separação dos dados em duas partes, uma para treinamento e outra para teste, foram
testados sete modelos de previsão, conforme Figura 35 (página 77):
Figura 35 – Gráfico de teste de melhor método - Previsões para gasto em dólar - Capítulo 29
2009 2010 2011 2012 2013 2014 2015 2016
40
00
00
00
0
60
00
00
00
0
80
00
00
00
0
Método Sazonal Naïve
Método da Média
Método Naïve
Método Holt Alpha
Método SES
Método da ETS (MAM)
Método ARIMA(1,1,1)
Dados de Teste
A linha tracejada representa os dados de teste, os dados reais. Essa linha será confrontada
com as outras linhas, que representam os métodos de previsão. Em uma leitura inicial do gráfico,
77
identifica-se que os métodos como o Naïve, da Média, SES e Holt Alpha são lineares, ao contrário
dos dados de teste, e ficaram em uma posição distantes em relação aos dados de teste. Isso indica
um baixo desempenho em relação às previsões. Os outros métodos se comportaram melhor, no
entanto, apenas com a avaliação visual do gráfico corre-se o risco de realizar uma avaliação
incorreta. Dessa maneira, procurando tornar a avaliação mais objetiva, foi feita uma tabela com
os erros de previsão para cada um dos métodos, os quais são apresentados na Tabela 22 (página
78):
ME RMSE MAE MPE MAPE MASE tipo
4 971395.72 159116947.74 137118689.69 -0.73 19.99 1.76 Holt Alpha
3 0.00 135834176.61 107938693.00 -4.27 16.76 1.39 Média
7 48252133.02 98009724.09 77860639.36 6.47 10.77 1.00 SNaive
5 1107854.77 89223159.66 70280339.31 -0.60 10.00 0.90 Naive
6 1436302.41 84799932.58 68987700.00 -0.69 9.88 0.89 SES
1 -6120681.96 57363722.04 42149015.57 -1.02 5.80 0.54 ARIMA(111)(001)
2 -5075064.25 51862064.59 40605376.08 -1.08 5.88 0.52 ETS(ANN)
Tabela 22 – Métodos de Previsão para o Capítulo 29
Assim, analisando a Figura 35 (página 77) e a Tabela 22 (página 78), optou-se pelo
método ETS(ANN), por possuir um bom valor para o MAPE e o menor MASE, e assim possuir
o menor erro de previsão em relação aos dados de teste. A partir da escolha do método mais
adequado, foi realizada a previsão conforme a Figura 36 (página 78).
Figura 36 – Gráfico de previsão utilizando-se do modelo ETS(ANN) - Capítulo 29 - Dólar
Ano
D
ól
ar
es
2010 2012 2014 2016
40
00
00
00
0
70
00
00
00
0
10
00
00
00
00
É possível notar na Figura 36, que as previsões são mostradas como uma linha azul, com
os intervalos de previsão de 80% como uma área sombreada de cinza escuro e os intervalos de
predição de 95% como uma área sombreada em cinza claro.
78
VI Previsões para o Capítulo 30
A partir da interpretação das características da série temporal, foi pesquisado o melhor
modelo para realizar as previsões, levando-se em consideração tais características. Com a meto-
dologia de separação dos dados em duas partes, uma para treinamento e outra para teste, foram
testados sete modelos de previsão, conforme Figura 37 (página 79).
Figura 37 – Gráfico de teste de melhor método - Previsões para gasto em Dólar - Capítulo 30
2009 2010 2011 2012 2013 2014 2015 2016
30
00
00
00
0
50
00
00
00
0
70
00
00
00
0
Método Sazonal Naïve
Método da Média
Método Naïve
Método Holt Alpha
Método SES
Método da ETS (ANN)
Método ARIMA(1,1,1)
Dados de Teste
A linha tracejada representa os dados de teste, ou dos dados reais. Essa linha será
confrontada com as outras linhas, que representam os métodos de previsão. Em uma leitura
inicial do gráfico, identifica-se que os métodos como o Naïve, da Média e Holt Alpha são lineares,
ao contrário dos dados de teste, e ficaram em uma posição distante em relação aos dados de teste.
Isso indica um baixo desempenho em relação às previsões. Os outros métodos se comportaram
melhor, no entanto, apenas com a avaliação visual do gráfico corre-se o risco de realizar uma
avaliação incorreta. Dessa maneira, procurando tornar a avaliação mais objetiva, foi feita uma
tabela com os erros de previsão para cada um dos métodos, conforme Tabela 23 (página 79).
ME RMSE MAE MPE MAPE MASE tipo
4 0.00 103386413.06 84217144.68 -4.89 18.41 1.14 Média
7 40883757.92 90692052.89 73885312.45 7.21 13.73 1.00 SNaive
5 2351092.51 89904025.43 74623459.23 -0.98 14.79 1.01 Naive
3 -1160247.21 79223262.44 62585800.48 -1.26 12.70 0.85 Holt Alpha
6 7954670.44 69912985.09 56702210.64 -0.04 11.52 0.77 SES
1 -11489345.06 62385704.44 46337057.72 -3.03 8.92 0.63 ARIMA(111)(001)
2 -2041338.68 54933812.17 42393269.36 -1.53 8.54 0.57 ETS(ANN)
Tabela 23 – Métodos de Previsão para o Capítulo 30
Assim, analisando a Figura 37 (página 79) e a Tabela 23 (página 79), optou-se pelo
método ETS(ANN), por possuir um bom valor para o MAPE e o menor MASE, para, dessa
forma, possuir o menor erro de previsão em relação aos dados de teste. A partir da escolha do
79
método mais adequado, foi realizada a previsão conforme a Figura 38 (página 80).
]
Figura 38 – Gráfico de previsão utilizando-se do modelo ETS para Capítulo 30 - Dólar
Ano
D
ól
ar
es
2010 2012 2014 2016
30
00
00
00
0
50
00
00
00
0
70
00
00
00
0
É possível notar na Figura 38 (página 80), que as previsões são mostradas como uma
linha azul, com os intervalosde previsão de 80% como uma área sombreada de cinza escuro e os
intervalos de predição de 95% como uma área sombreada em cinza claro.
4.2 Sistema DATASUS
A partir deste ponto serão analisados os dados referentes ao sistema DATASUS, por meio
de conceitos da estatística descritiva. Antes da análise, será feita a explanação de como foi obtido
os dados utilizados neste estudo.
Etapa 01 - Seleção de Dados
Por meio do site do DATASUS (DATASUS, 2017b), o MS disponibiliza dados para
subsidiar a análises da situação sanitária, para a tomadas de decisão baseadas em evidências e
para a elaboração de programas de ações de saúde.
Os dados disponíveis são organizados e classificados da seguinte forma:
• Morbidade: ocorrências que levam às internações;
• Incapacidade: ocorrências que levam à incapacidade;
• Acesso a serviços: exames, afastamentos e outros;
• Qualidade da atenção: Vacinações e outros;
• Condições de vida e fatores ambientais: saúde no trabalho e outos;
• Assistência à Saúde da população: acesso ao SUS;
80
• Cadastros (Rede Assistencial) das redes hospitalares e ambulatoriais: unidades credenciadas;
• Cadastro dos estabelecimentos de saúde: unidades credenciadas;
• Informações sobre recursos financeiros: gastos do MS;
• Informações Demográficas e Socioeconômicas: dados de saúde.
Além disso, em Saúde Suplementar, são apresentados os links para as páginas de infor-
mações da Agência Nacional de Saúde Suplementar (ANS). Especificamente no presente estudo,
serão utilizados os dados de morbidade. Para acesso aos dados, é necessário o acesso ao Tabulador
TABNET.
O aplicativo TABNET é um tabulador genérico, de domínio público, que permite organizar
dados de forma rápida, conforme a consulta que se deseja tabular. Foi desenvolvido pelo DATASUS
para gerar informações das bases de dados do Sistema Único de Saúde (TABNET, 2017).
Para acessar o sistema, é necessário acessar o site do DATASUS (DATASUS, 2017b), no
menu do lado esquerdo, opção "informações de Saúde TABNET", que está representado pela
Figura 39 (página 81).
Figura 39 – Tela TABNET - Morbidades
Ainda na tela do TABNET, no menu do lado esquerdo, é necessário clicar na opção
"Epidemiológicas e Morbidades" e posteriormente no grupo de opções "Morbidade Hospitalar do
SUS (SIH/SUS)". Essas opções estão destacadas através dos círculos. Na sequência, é necessário
escolher a opção "Geral, por local de internação, a partir de 2008" e ainda escolher a opção
"Abrangência geográfica: Brasil por município", conforme Figura 40 (página 82).
Por fim, é necessário escolher os filtros para a geração das tabelas. A Figura 41 apresenta
como deve ser feita a geração das tabelas. Os filtros estão indicados pelos círculos enumerados.
Apenas o filtro "coluna" não foi selecionado, devido ao não interesse nesta pesquisa. O filtro 1
representa a abrangência das internações, ou seja, no Brasil (em todo território nacional). O
81
Figura 40 – Tela TABNET - Opções Morbidades
filtro 2 é a opção da coluna mais à esquerda, da planilha gerada, cuja característica principal é
ser uma série temporal e, como tal, possui os meses e anos da observação. O filtro 3 representa o
conteúdo da planilha ou os campos nos quais o usuário tem interesse. O filtro 4 é a abrangência
da pesquisa, que no presente estudo representa o perído de janeiro de 2009 à junho de 2016.
Por fim, o filtro 5 representa a opção das doenças do Capítulo CID-10, sendo que é necessária a
escolha das doenças, uma a uma, gerando 312 planilhas. Essa tela está representada pela Figura
41 (página 83):
Foram geradas 312 tabelas, ou seja, 312 morbidades e suas respectivas internações, óbitos,
valores etc.
Etapa 02 - Pré-processamento e Limpeza de Dados
Foram geradas 312 planilhas com extensão .CSV, sendo que cada uma das planinhas
representa uma morbidade do CID - 10. Essas planilhas exigem menos pré-processamento que
o ALICEWeb, no entanto, apresentam também problemas de formatação. A começar pelos
cabeçalhos, que não apresentam um padrão. A partir do cabeçalho, as rotinas identificam qual
morbidade que está se referindo. No entanto, conforme observado nas Figuras 42 e 43, a localização
da morbidade, em algumas planilhas, está na linha 2 e, em outras, na linha 3. Isso causa uma série
de problemas e exigiu o desenvolvimento de uma rotina apenas para identificar tal característica.
82
Figura 41 – Tela TABNET - filtro das Morbidades
Figura 42 – Cabeçalho Planilha SIH - SUS 1
83
Figura 43 – Cabeçalho Planilha SIH - SUS 2
Etapa 03 - Transformação dos Dados
Um total de 32 planilhas apresentaram problemas: ou estavam faltando meses, ou possuíam
inconsistências nos dados ou, ainda, não havia registro e. Portanto, foram eliminadas do futuro
cruzamento. As planilhas da Figura 44 apresentam as morbidades que foram eliminadas:
Figura 44 – Planilhas de Morbidades que foram eliminadas
Sobraram então 280 planilhas, ou 280 morbidades, que puderam ser analisadas pelas
técnicas de modelagem que serão apresentadas na próxima seção.
Etapa 04 - Mineração de Dados
Foi utilizada a estatística descritiva para a comparação entre as morbidades com maior
número de internações, gastos e óbitos. Na sequência, foram analisados, por meio de séries
84
temporais, os comportamentos das morbidades que mais se destacaram na análise anterior. Assim,
foram considerados os modelos que resultaram na criação de novos conhecimentos e contribuíram
para a gestão em saúde. As estruturas de dados não foram aglutinadas em um único banco de
dados.
Etapa 05 - Analise e Interpretação das Informações do Sistema DATASUS
A análise dos dados, fornecidos pelo DATASUS, objetiva a realização de interpretações
quantitativas, realizadas por meio de estatísticas descritivas e inferências desses dados. Como
resultado dessa análise, é possível realizar conclusões, previsões e, principalmente, a descoberta
de novos conhecimentos a partir das bases de dados que foi construída.
O banco de dados constituído no presente estudo forma um conjunto de observações
ordenadas no tempo. Esse tempo refere-se ao período de 2009 à junho/2016, e o objetivo é
analisar o comportamento das variáveis internações e óbitos ocorridos em função das internações.
Para verificar a relação entre as variáveis, foi analisado tanto separadamente quanto em
conjunto. Inicialmente, conforme Figura 45, serão analisados quais são as morbidades que mais
geraram internações pelo SUS:
Figura 45 – As 10 Morbidades com maior número de internações
P
ar
to
 ú
ni
co
 e
sp
on
tâ
ne
o
P
ne
um
on
ia
O
ut
ra
s 
co
m
pl
ic
aç
õe
s 
da
 g
ra
vi
de
z 
e 
d
F
ra
tu
ra
 d
e 
ou
tr
os
 o
ss
os
 d
os
 m
em
br
os
In
su
fic
iê
nc
ia
 c
ar
dí
ac
a
C
ol
el
ití
as
 e
 e
co
le
ci
st
ite
O
ut
r 
m
ot
as
s 
à 
m
ãe
 r
el
 c
av
 fe
ta
l a
m
n
O
ut
ra
s 
do
en
ça
s 
do
 a
pa
re
lh
o 
ur
in
ár
io
O
ut
ra
s 
do
en
ça
s 
in
fe
cc
io
sa
s 
in
te
st
in
R
es
ta
nt
e 
de
 o
ut
ra
s 
do
en
ça
s 
ba
ct
er
ia
0
2158894
4317787
6476681
8635574
Como observado, a morbidade com maior número de internações é o "Parto", seguida por
"Pneumonia". As morbidades "Outras complicações da gravidez" e "fratura de outros ossos do
membro" também estão em um nível maior. Já entre as morbidades "insuficiência cardíaca" e
"Restante de outras doenças de bactéria" apresentam números muitos próximos de internações.
O gráfico apresentado na Figura 46 (página 86) permite analisar quais são as morbidades
que mais geram gastos, a partir de suas internações:
Conforme observado, o "Parto" também é o de maior gasto. No entanto, a morbidade
"Outras doenças isquêmicas do coração", que não aparece entre as 10 maiores em casos, aparece
como a segunda em gastos pelo SUS.
85
Figura 46 – 10 Morbidades com maiores gastos em reais
P
ar
to
 ú
ni
co
 e
sp
on
tâ
ne
o
O
ut
ra
s 
do
en
ça
s 
is
qu
êm
ic
as
 d
o 
co
ra
çã
P
ne
um
on
ia
O
ut
ra
s 
co
m
pl
ic
aç
õe
s 
da
 g
ra
vi
de
z 
e 
d
O
ut
ra
s 
do
en
ça
s 
do
 a
pa
re
lho 
re
sp
ira
t
In
su
fic
iê
nc
ia
 c
ar
dí
ac
a
S
ep
tic
em
ia
In
fa
rt
o 
ag
ud
o 
do
 m
io
cá
rd
io
In
su
fic
iê
nc
ia
 r
en
al
O
ut
ro
s 
tr
an
st
 r
es
pi
ra
tó
rio
s 
or
ig
 p
e
0
1202412881
2404825763
3607238644
4809651526
O gráfico da Figura 47 (página 86) permite analisar quais são as morbidades com o maior
número de óbitos:
Figura 47 – 10 morbidades que geram o maior número de óbitos
P
ne
um
on
ia
S
ep
tic
em
ia
O
ut
ra
s 
do
en
ça
s 
do
 a
pa
re
lh
o 
re
sp
ira
t
In
su
fic
iê
nc
ia
 c
ar
dí
ac
a
A
ci
d 
va
sc
ul
ar
 c
er
eb
r 
nã
o 
es
pe
c 
he
m
o
R
es
ta
nt
e 
de
 o
ut
ra
s 
do
en
ça
s 
ba
ct
er
ia
In
su
fic
iê
nc
ia
 r
en
al
In
fa
rt
o 
ag
ud
o 
do
 m
io
cá
rd
io
Tr
au
m
at
is
m
o 
in
tr
a 
cr
an
ia
no
O
ut
r 
si
st
 s
in
ai
s 
ac
ha
da
 n
or
m
 e
x 
cl
í
0.0
87828.5
175657.0
263485.5
351314.0
A "Pneumonia", assim como aparece nas primeiras posições na classificação por "Gastos"
e na "Quantidade de Internações", aparece também no gráfico, referente à Figura 47, como a
morbidade com maior número de óbitos no Brasil, seguido por "Septicemia". A Figura 48 (página
87) apresenta o Gráfico de Internações versus Óbitos:
O gráfico possui dois eixos, o esquerdo, referente aos milhares de internamento, e o direito,
referente aos milhares de óbitos. Possui, ainda, linhas de cor preta e azul, que representam,
respectivamente, o comportamento das internações e os óbitos ao longo do período. Além dessas
características, possui também duas linhas de tendência, a de cor vermelha, que representa a
86
Figura 48 – Comparativo de Internações e Óbitos de Pneumonia(2009-06/2016)
2010 2012 2014 2016
40
00
0
50
00
0
60
00
0
70
00
0
80
00
0
40
00
0
50
00
0
60
00
0
70
00
0
80
00
0
M
ilh
ar
es
 d
e 
in
te
rn
aç
õe
s
25
00
30
00
35
00
40
00
45
00
50
00
Ó
bi
to
s
Período 
Internações
Tendência Intern.
Óbitos
Tendência óbitos
tendência das internações, e a de cor branca, que representa a tendência dos óbitos.
É possível notar no gráfico da Figura 48 (página 87), referente ao período de 2009 a
junho/2016, que fica evidente que o gráfico possui uma forte sazonalidade, diminuindo os casos
no verão e aumentando no inverno; as internações estão com tendência de queda, ou seja, uma
diminuição de casos (em vermelho); os óbitos estão com tendência de alta, ou seja, com um
aumento de casos (em branco).
Já a "Septicemia", que aparece em segundo lugar no gráfico de óbitos, referente à Figura
47, possui o seguinte comportamento ao longo do tempo, conforme Figura 49 (página 87):
Figura 49 – Comparativo de Internações e Óbitos de Septicemia(2009-06/2016)
2010 2012 2014 2016
50
00
60
00
70
00
80
00
90
00
10
00
0
50
00
60
00
70
00
80
00
90
00
10
00
0
M
ilh
ar
es
 d
e 
in
te
rn
aç
õe
s
20
00
25
00
30
00
35
00
40
00
45
00
Ó
bi
to
s
Período 
Internações
Tendência Intern.
Óbitos
Tendência óbitos
O gráfico possui dois eixos, o esquerdo, referente aos milhares de internamento, e o direito,
referente aos milhares de óbitos. Possui, ainda, linhas de cor preta e azul, que representam,
87
respectivamente, o comportamento das internações e os óbitos ao longo do período. Além dessas
características, possui também duas linhas de tendência, a de cor vermelha, que representa a
tendência das internações, e a de cor branca, que representa a tendência dos óbitos.
É possível notar que no gráfico apresentado na Figura 49 (página 87), referente ao período
de 2009 a Junho/2016, fica evidente que a morbidade possui uma forte tendência de alta, tanto
para os casos de internações como os óbitos em função dessas internações.
A criação do conhecimento a partir das bases de dados do SIH - SUS ficou representada
pelos gráficos exibidos anteriormente. Essa criação do conhecimento pode colaborar com a Gestão
em Saúde, por meio da interpretação dos gráficos gerados. Ocorreu apenas a partir de uma base
de dados, a do SIH - SUS. No próximo capítulo será realizada a criação do conhecimento a partir
do cruzamento dos dados do sistema SIH - SUS e do sistema ALICEWeb, conforme veremos na
sequência.
4.3 Análise e interpretação do cruzamento das informações nos sistemas DATASUS e ALI-
CEWeb
A lógica desse cruzamento consiste em verificar, para cada uma das morbidades (em
um total de 312), qual o valor da correlação em referência a todas as mercadorias (em um
total de 1363). Portanto, houve 425.256 análises de correlação entre as variáveis Morbidades e
Mercadorias. Essa quantidade de análise foi realizadas utilizando-se de tempos iguais, ou seja,
morbidades ocorridas em Janeiro/2009 foram comparandas com todas as importações ocorridas
em Janeiro/2009. No entanto, considerando que o comportamento de uma importação pode não
refletir em relação às morbidades imediatamente, ou seja, no mesmo mês, foi realizado também
um estudo de correlação com seis meses de diferença (comparou-se Morbidades ocorridas em
junho/2009 com importações ocorridas em Janeiro/2009). Esses dois cruzamentos produziram
um total de 850.512 análises de correlação entre as variáveis Morbidades e Mercadorias. Os dois
cruzamentos de dados estão disponíveis nos Apêndices I e II deste estudo. Um exemplo, da
morbidade Cólera, está representada na Figrua 50:
Figura 50 – Morbidade e Fármacos correlacionados
Fonte: O Autor
Conforme Figura 50, a morbidade Cólera possui correlação significativa com seis fármacos,
que estão representados também na mesma Figura. Para exemplificar, a Cólera possui, em uma
88
escala de -1 até 1, uma correlação positiva significativa de 0.8117 em relação ao Ácido tioglicólico
e seus sais. Os apêndices seguem estes padrões, aparecendo a morbidade no cabeçalho e os
fármacos relacionados nas linhas abaixo.
Com relação aos resultados desses cruzamentos, por meio do auxílio de especialistas da área
da Saúde, notou-se que houve correlações significativas, tanto positivas quanto negativas, entre
os compostos e as morbidades. No entanto, não foi encontrado, nas duas formas de cruzamentos,
correlaçãos que fizessem sentido. Assim, todas as correlações podem ser consideradas espúrias,
ou seja, essas correlações são meras coincidências estatísticas.
4.4 Considerações Finais
Inicialmente, foram definidos os principais conceitos de Gestão do Conhecimento, Inte-
ligência Artificial, KDD e Mineração de Dados. Especificamente quanto a GC, foi explorado
também a GC na saúde pública brasileira (Ministério da Saúde) e a Gestão da Informação em
saúde.
Foi proposto ainda um modelo de KDD para o problema de pesquisa. Esse modelo,
denominado Modelo Buzeti, propôs uma formulação teórica, um caminho, para a extração
de novos conhecimentos, a partir dos dados públicos fornecidos pelos Sistemas ALICEWeb e
DATASUS. O Modelo foi criado tendo como referência o Método de KDD de Fayyad et al. (1996).
A partir da aplicação do Modelo Buzeti, foi construído um banco de dados, individual
para cada sistema, seguindo as fases propostas pelo modelo. A partir dessa construção, foram
discutidos e analisados os resultados da criação de conhecimento. Foram realizado, ainda, previsões
de importação de fármacos para meses futuros.
Por fim, foi realizado o cruzamento dos dados dos dois sistemas, resultando nos Apêndices
I e II, os quais foram analisados por profissionais da saúde, com o intuito de verificar se as
correlações encontradas possuem casualidade.
89
5 Conclusão
O presente estudo propôs, como objetivo geral, a criação do conhecimento utilizando
técnicas do KDD. Como estudo de caso foram utilizados dados públicos disponíveis dos sistemas
DATASUS e ALICEWeb.
Inicialmente, foi fundamentada a Gestão do Conhecimento, por meio da explanação de
seus conceitos, fases, técnicas, ferramentas, tecnologias e ciclos que a formam. Foi dada ênfase na
fase de criação do conhecimento, por meio do conceito do KDD, que procura descobrir padrões,
grupos, falhas, tendências e/ou outros conhecimentos relevantes, por meio da análisede grandes
conjuntos de dados.
Foi também explorada a Gestão do Conhecimento na área da saúde, mais especificamente,
no Ministério da Saúde. Conclui-se que a Gestão do Conhecimento possui papel importante
no Ministério, aparecendo oficialmente na estrutura organizacional desse órgão. No entanto,
há evidências de que a GC não evolui no Ministério a partir de 2004, sendo necessário o
desenvolvimento estratégico desse tema.
Foi feita a verificação dos estudos realizados para a descoberta do conhecimento na área
da saúde, por meio da revisão sistemática. Nessa revisão, foram explorados artigos, estudos,
dissertações e outros que abordassem temas como inteligência nas organizações públicas e outros.
No estudo, foram abordadas as fases que formam a metodologia KDD e como essas fases
foram implantadas. Foi também criado um Modelo para a preparação dos dados públicos de
importação e dados públicos de morbidade, a qual tornou possível a análise destes. O Modelo
Buzeti é composto por cinco etapas, sendo uma delas a Mineração de Dados. O modelo propôs
uma formulação teórica, um caminho, para a extração de novos conhecimentos a partir dos dois
sistemas. Assim, essa pesquisa colaborou para a explicitação da complexidade dessas bases e
desenvolveu um procedimento para a construção de um banco de dados único a partir da junção
de centenas de tabelas geradas pelos sistemas ALICEWeb e DATASUS.
Este estudo teve como objetivo geral a criação do conhecimento, utilizando as técnicas
do KDD, tendo como fonte de dados os sistemas DATASUS e ALICEWeb. Como a quantidade
de dados públicos analisados é de grande volume e com considerável complexidade, este estudo
contribui principalmente no demonstrar que a metodologia utilizada e o Modelo Buzeti criado,
advinda dos conceitos de descoberta de conhecimento de dados, são aplicáveis. Salienta-se que
este estudo também contribui para futuras pesquisas que necessitem seguir uma metodologia
para aquisição de novo conhecimento advindo de dados públicos.
Com a aplicação do Modelo Buzeti desenvolvido, para a criação de novo conhecimento, a
partir de dados públicos dos sistemas ALICEWeb e DATASUS, tornou-se possível a realização da
mineração de dados. A primeira base de dados explorada foi a vinculada ao sistema ALICEWeb.
Apesar da riqueza dos dados do sistema, com décadas de registro, pesquisas que necessitam da
junção de vários anos e mercadorias, como esta, são dificultosas em função da forma como os
dados são gerados. A diferença de quantidades de mercadorias por ano e, ainda, a forma como
esses dados são estruturados pelo sistema também são algumas das dificuldades encontradas
nessa base de dados. Como resultado obtido, temos os seguintes novos conhecimentos:
90
• Os gráficos de importação de mercadorias, para os três capítulos (28, 29 e 30), sugerem que
os programas de incentivo à inovação e ao comércio exterior, como o PITCE e PROFARMA,
estão diminuindo as importações brasileiras de mercadorias ligadas ao setor farmacêutico.
• Apesar de haver uma significativa correlação linear entre as variáveis Dólar e Kg, nos três
capítulos (28, 29 e 30), há mercadorias que não seguem essa lógica, não tendo correlação
significativa. Essas mercadorias foram vinculadas às morbidades e nos tratamentos que são
indicados por meio do auxílio de profissionais da área da saúde.
Na realização das previsões de importação de fármacos para meses futuros, dos três
Capítulos estudados, foram obtidos previsões para o ano de 2016, a partir do estudo de métodos
de previsões. Esses métodos foram escolhidos a partir do estudo do comportamento destes em
relação aos dados de treinamento e de teste.
A segunda base de dados explorada foi a vinculada ao sistema DATASUS. Mais especifi-
camente ao Sistema de Informações Hospitalares, que forneceu os dados sobre as internações e
morbidades atendidas pelo SUS. A obtenção dos dados e a estrutura das tabelas geradas podem
ser considerados de fácil acesso e baixa complexidade. No entanto, foram detectados alguns
problemas quanto à falta de padrões na geração das tabelas. Essa falta de padrão colaborou
para a dificuldade em construir uma base de dados única para a análise das morbidades e suas
internações. A fase da criação do conhecimento da GC, então, foi realizada, o que gerou alguns
gráficos de comportamento das morbidades, exibindo as quantidades de internações e, ainda,
como essas internações estão relacionadas a seus respectivos óbitos.
Por último, foram produzido novos conhecimentos por meio da análise das relações, a
partir do cruzamento dos dados dos sistemas DATASUS e ALICEWeb. Mais detalhadamente,
foi realizado o cruzamento das 312 morbidades com as 1363 mercadorias. Esse cruzamento
produziu duas tabelas (Apêndice I e II), as quais as morbidades demonstraram que possuíam
alguma relação significativa com ao menos uma mercadoria. Outras morbidades não apresentaram
qualquer relação significativa. Esse cruzamento resultou na criação de conhecimento cuja análise
foi feita por profissionais de saúde, sendo essa a principal característica da interdisciplinaridade
deste estudo. Essa análise demonstrou que não há correlação entre mercadorias importadas e
internações por morbidades, cujo resultado está no Anexo I.
Cada uma das fontes de dados, os sistemas ALICEWeb e DATASUS, assim como o
cruzamento entre essas fontes, que geraram novos conhecimentos, oferecem mais possibilidades
de pesquisas futuras. No sistema ALICEWeb, as Tabelas 26, 28 e 30, em função de não haver
uma correlação significativa entre Quilogramas e Dólar, pode-se realizar um estudo específico das
principais mercadorias, virificando quais os motivos pelos quais isso poderia estar ocorrendo. Já
nas previsões para o ano de 2016, em relação aos gastos em dólar nas importações de mercadorias,
faz-se necessário o confronto entre a projeção indicada pelo método escolhido e o que ocorreu
com os dados reais de importação (Figuras 33, 35 e 37).
Já nos dados do DATASUS, há a possibilidade de diversas pesquisas, utilizando-se dessa
mesma base. Como exemplo, podem-se analisar os óbitos com os valores gastos ou, ainda, se há
correlação entre os dias de permanência e os óbitos.
91
Em relação ao cruzamento dos dados das duas bases, há a necessidade de realizar pesquisas
futuras em relacionadas ao tempo em que ocorrem essas correlações. Nesta presente pesquisa
foram considerados dois tipos de comparação:
• tempos iguais, ou seja, foram comparados, por exemplo, as importações das mercadorias
de janeiro de 2009 com as internações de janeiro de 2009 (T1 = T2) (Anexo I);
• tempos diferentes, ou seja, as importações do mês de janeiro de 2009 com as internações
do mês de junho de 2009 (T1 = T2 + 6).
Há a necessidade de realizar comparações de outros tempos. Podem-se comparar as
importações das mercadorias com outros tempos de internações por morbidade, explorando
o maior número de cenários. Também pode-se verificar as correlações com outros cortes de
significância de correlação.
92
Referências
ABIQUIM/DETEC. O que é o GHS? Sistema harmonizado globalmente para a classificação e
rotulagem de produtos químicos. São Paulo: [s.n.], 2005. 69 p. Citado na página 53.
ACTION, P. : Séries temporais / introdução / 1.1 - estacionariedade. 2016. Disponível em:
<http://www.portalaction.com.br/series-temporais/11-estacionariedade>. Acesso em: 18 julr.
2016. Citado na página 40.
ALICEWEB: Aliceweb. 2016. Disponível em: <http://aliceweb.mdic.gov.br//menu/index/item/
metodologia>. Acesso em: 26 abr. 2016. Citado na página 51.
ALICEWEB: Tutorial. 2017. Disponível em: <http://aliceweb.mdic.gov.br//public/arquivos/
tutorial/tutorial_ptBr.zip>. Acesso em: 22 jan. 2017. Citado na página 51.
ALÍS, J. C.; PÉREZ, D. G. La"metodología de la superficialitat"i l’aprenentatge de les ciències.
Enseñanza de las Ciencias, v. 3, n. 2, p. 113–120, 1985. Nenhuma citação no texto.
ALMIRON, M. G. et al. R é confiável para estatística computacional? 2010. Citado na página
49.
ANTUNES, J. L. F.; CARDOSO, M. R. A. Uso da análise deséries temporais em estudos
epidemiológicos. Epidemiologia e Serviços de Saúde, 2015. Citado na página 39.
AZEVEDO, L. F. d. A. Uso de informações de saúde para suporte à decisão: uma metodologia
focada no consumidor da informação. 2009. Citado na página 42.
BARBOSA, A. N. Descoberta de conhecimento aplicado à base de dados textual de saúde.
Universidade do Vale do Rio dos Sinos, 2012. Citado na página 43.
BARR, A. Feigenbaum. ea,"the handbook of artificial intelligence,"volumes i and ii, william
kaufmann. Inc., Los Altos, Ca, 1981. Citado na página 25.
BASKERVILLE, R.; DULIPOVICI, A. The theoretical foundations of knowledge management.
Knowledge Management Research & Practice, Nature Publishing Group, v. 4, n. 2, p. 83–105,
2006. Nenhuma citação no texto.
BATISTA, F. F. Modelo de gestão do conhecimento para a administração pública brasileira: como
implementar a gestão do conhecimento para produzir resultados em benefício do cidadão. Brasil.
Instituto de Pesquisa Econômica Aplicada (Ipea). Diretoria de Desenvolvimento Institucional
(Dides), 2012. Nenhuma citação no texto.
BATISTA, F. F. Gestão do conhecimento na administração pública: resultados da pesquisa ipea
2014–grau de externalização e formalização. Instituto de Pesquisa Econômica Aplicada (Ipea),
2015. Nenhuma citação no texto.
BRASIL. TARIFA EXTERNA COMUM BRASIL: Atualizada até a resolução camex n 32 de
01/04/2016 (d.o.u. 04/04/2016). 2016. Disponível em: <http://www.desenvolvimento.gov.br/
/arquivos/dwnl_1460569075.doc>. Acesso em: 17 maio. 2016. Citado na página 52.
BRUM, R. M. de. Preparador de goleiros da Seleção Olímpica. 2016. Disponível em: <http:
//rogeriomaia.net/estudo-dica-de-auxiliar-e-taffarel-os-bastidores-da-defesa-de-weverton/>.
Acesso em: 14 set. 2016. Citado na página 21.
93
http://www.portalaction.com.br/series-temporais/11-estacionariedade
http://aliceweb.mdic.gov.br//menu/index/item/metodologia
http://aliceweb.mdic.gov.br//menu/index/item/metodologia
http://aliceweb.mdic.gov.br//public/arquivos/tutorial/tutorial_ptBr.zip
http://aliceweb.mdic.gov.br//public/arquivos/tutorial/tutorial_ptBr.zip
http://www.desenvolvimento.gov.br//arquivos/dwnl_1460569075.doc
http://www.desenvolvimento.gov.br//arquivos/dwnl_1460569075.doc
http://rogeriomaia.net/estudo-dica-de-auxiliar-e-taffarel-os-bastidores-da-defesa-de-weverton/
http://rogeriomaia.net/estudo-dica-de-auxiliar-e-taffarel-os-bastidores-da-defesa-de-weverton/
BRUNI, A. SPSS - GUIA PRATICO PARA PESQUISADORES. ATLAS, 2012. ISBN
9788522474653. Disponível em: <https://books.google.com.br/books?id=atO2NAEACAAJ>.
Citado na página 66.
BUZETI, L. C.; ALMEIDA, I. C. de; BERNUCI, M. P. Utilização de Ferramentas da Gestão
do Conhecimento para o Entendimento da Relação entre Gasto em Dólares e Quilogramas de
Fármacos. 2016. Disponível em: <http://degecop.wixsite.com/simposio/edicao-atual>. Acesso
em: 02 fev. 2017. Citado na página 45.
CHECHI, L.; BAYER, F. M. Modelos univariados de séries temporais para previsão das tempe-
raturas médias mensais de erechim, rs. Revista Brasileira de Engenharia Agrícola e Ambiental,
v. 16, n. 12, p. 1321–1329, 2012. Citado na página 39.
CHIAVEGATTO, F. A. Big Data em Saúde no Brasil. [S.l.]: Universidade de São Paulo and
offered through Coursera, 2016. Citado na página 26.
CLEMENTE, V. et al. Proposta de gestão da trombose venosa profunda através de mineração
de dados. Revista Acreditação, v. 3, n. 5, p. 34–38, 2013. Citado na página 44.
CORREIA, R. B. et al. The use of information systems in health care facilities: A brazilian case.
Journal of technology management & innovation, SciELO Chile, v. 8, p. 72–72, 2013. Citado na
página 44.
COSTA, S. M. d. S. Fundamentação teórica sobre gestão do conhecimento e ciência da informação.
Organização Pan-Americana da Saúde, 2009. Citado na página 18.
DAHL, D. B. xtable: Export Tables to LaTeX or HTML. [S.l.], 2016. R package version 1.8-2.
Disponível em: <http://CRAN.R-project.org/package=xtable>. Citado na página 49.
DALKIR, K. Knowledge Management in Theory and Practice. Elsevier Science, 2005. ISBN
9780080547367. Disponível em: <https://books.google.com.au/books?id=xtFLTymKV0QC>.
Citado 6 vezes nas páginas 15, 16, 18, 19, 20 e 22.
DALSTON, C. O. O que é constituição quḿica definida dos capítulos 28 e
29 da NCM? 2016. Disponível em: <http://classificacao.dalston.com.br/2010/09/
o-que-e-constituicao-quimica-definida-dos-capitulos-28-e-29-da-ncm/>. Acesso em: 17
maio. 2016. Citado na página 69.
DAMA: Gestão, governança e qualidade de dados e da informação. 2016. Disponível em: <http:
//www.dama.org.br/gestao-governanca-e-qualidade-de-dados-e-informacoes/>. Acesso em: 05
Jul. 2016. Citado na página 35.
DATASUS. Cadastros Nacionais. 2017. Disponível em: <http://datasus.saude.gov.br/
sistemas-e-aplicativos/cadastros-nacionais>. Acesso em: 25 jan. 2017. Citado na página 31.
DATASUS: Departamento de informática do sus. 2017. Disponível em: <http://www2.datasus.
gov.br/DATASUS/index.php>. Acesso em: 22 jan. 2017. Citado 2 vezes nas páginas 80 e 81.
DATASUS. Propostas Preliminares. 2017. Disponível em: <http://datasus.saude.gov.br/
informacoes-de-saude/servicos2/politicas>. Acesso em: 25 jan. 2017. Citado na página 31.
DATASUS. Tabuladores. 2017. Disponível em: <http://www2.datasus.gov.br/DATASUS/index.
php?area=0608>. Acesso em: 25 jan. 2017. Citado na página 32.
DAVILA, G. A. et al. O ciclo de gestão do conhecimento na prática: Um estudo nos núcleos
empresariais catarinenses. International Journal of Knowledge Engineering and Management
(IJKEM), v. 3, n. 7, p. 43–64, 2014. Citado na página 19.
94
https://books.google.com.br/books?id=atO2NAEACAAJ
http://degecop.wixsite.com/simposio/edicao-atual
http://CRAN.R-project.org/package=xtable
https://books.google.com.au/books?id=xtFLTymKV0QC
http://classificacao.dalston.com.br/2010/09/o-que-e-constituicao-quimica-definida-dos-capitulos-28-e-29-da-ncm/
http://classificacao.dalston.com.br/2010/09/o-que-e-constituicao-quimica-definida-dos-capitulos-28-e-29-da-ncm/
http://www.dama.org.br/gestao-governanca-e-qualidade-de-dados-e-informacoes/
http://www.dama.org.br/gestao-governanca-e-qualidade-de-dados-e-informacoes/
http://datasus.saude.gov.br/sistemas-e-aplicativos/cadastros-nacionais
http://datasus.saude.gov.br/sistemas-e-aplicativos/cadastros-nacionais
http://www2.datasus.gov.br/DATASUS/index.php
http://www2.datasus.gov.br/DATASUS/index.php
http://datasus.saude.gov.br/informacoes-de-saude/servicos2/politicas
http://datasus.saude.gov.br/informacoes-de-saude/servicos2/politicas
http://www2.datasus.gov.br/DATASUS/index.php?area=0608
http://www2.datasus.gov.br/DATASUS/index.php?area=0608
DBN: Dbn - detalhamento brasileiro de nomenclatura. 2016. Disponível em: <http://www.
desenvolvimento.gov.br/sitio/interna/interna.php?area=5&menu=3937>. Acesso em: 26 abr.
2016. Citado 2 vezes nas páginas 52 e 53.
DECIT. Departamento de Ciência e Tecnologia. 2017. Disponível em: <http:
//portalsaude.saude.gov.br/index.php/o-ministerio/principal/secretarias/sctie/
decit-departamento-de-ciencia-e-tecnologia>. Acesso em: 26 jan. 2017. Citado na pá-
gina 28.
DECRETO. DECRETO 8.901 - Ministério da Saúde. 2017. Disponível em: <http://www.
planalto.gov.br/CCIVIL_03/_Ato2015-2018/2016/Decreto/D8901.htm#art8>. Acesso em: 24
jan. 2017. Citado na página 29.
DEMARCHI, A. P. P. et al. Gestão estratégica de design com a abordagem de design thinking:
proposta de um sistema de produção do conhecimento. 2011. Citado na página 21.
DHANARAJ, C. et al. Managing tacit and explicit knowledge transfer in ijvs: the role of
relational embeddedness and the impact on performance. Journal of International Business
Studies, Springer, v. 35, n. 5, p. 428–442, 2004. Nenhuma citação no texto.
DOWNING, D.; CLARK, J. Estatística aplicada. Saraiva, 2002. ISBN 9788502036284. Disponível
em: <https://books.google.com.br/books?id=9w4wAAAACAAJ>. Citado na página 40.
DRUCKER, P. F.; DRUCKER, P. F. Post-capitalist society. [S.l.]: Routledge, 1994. Citado na
página 15.
ELMASRI, R. et al. Sistemas debanco de dados. Pearson Addison Wesley, 2005. Citado na
página 26.
FAYYAD, U.; PIATETSKY-SHAPIRO, G.; SMYTH, P. The kdd process for extracting useful
knowledge from volumes of data. Communications of the ACM, ACM, v. 39, n. 11, p. 27–34,
1996. Citado 2 vezes nas páginas 16 e 24.
FEDERAL, G. Acesso à Informação. 2017. Acesso em: 25 jan. 2017. Citado na página 30.
FEENSTRA, R. C.; INKLAAR, R.; TIMMER, M. P. The next generation of the penn world table.
American Economic Review, 2015. Forthcoming. Disponível em: <http://www.ggdc.net/pwt/>.
Citado na página 49.
FERNANDES, A. M. da R. Inteligência Artificial: noções gerais. [S.l.]: Visual Books, 2005.
Citado na página 25.
FLORES, J. a. H. F. Comparação de modelos MLP/RNA e modelos Box-Jenkins em séries
temporais não lineares. Dissertação (Mestrado) — Universidade Federal do Rio Grande do Sul.
Escola de Engenharia. Programa de Pós-Graduação em Engenharia de Produção, Porto Alegre,
2009. Citado na página 36.
FROTA, L. C. M. Inteligência nas organizações públicas de saúde: soluções e informações
estratégicas para gestão. 2009. Citado na página 42.
GERIRONLINE. Módulo: 06 - Ferramentas da Qualidade. 2017. Disponível em: <http:
//gerironline.dashofer.pt/?s=modulos&v=capitulo&c=24245>. Acesso em: 25 jan. 2017. Citado
na página 35.
GOEBEL, M.; GRUENWALD, L. A survey of data mining and knowledge discovery software
tools. ACM SIGKDD explorations newsletter, ACM, v. 1, n. 1, p. 20–33, 1999. Citado na página
24.
95
http://www.desenvolvimento.gov.br/sitio/interna/interna.php?area=5&menu=3937
http://www.desenvolvimento.gov.br/sitio/interna/interna.php?area=5&menu=3937
http://portalsaude.saude.gov.br/index.php/o-ministerio/principal/secretarias/sctie/decit-departamento-de-ciencia-e-tecnologia
http://portalsaude.saude.gov.br/index.php/o-ministerio/principal/secretarias/sctie/decit-departamento-de-ciencia-e-tecnologia
http://portalsaude.saude.gov.br/index.php/o-ministerio/principal/secretarias/sctie/decit-departamento-de-ciencia-e-tecnologia
http://www.planalto.gov.br/CCIVIL_03/_Ato2015-2018/2016/Decreto/D8901.htm#art8
http://www.planalto.gov.br/CCIVIL_03/_Ato2015-2018/2016/Decreto/D8901.htm#art8
https://books.google.com.br/books?id=9w4wAAAACAAJ
http://www.ggdc.net/pwt/
http://gerironline.dashofer.pt/?s=modulos&v=capitulo&c=24245
http://gerironline.dashofer.pt/?s=modulos&v=capitulo&c=24245
GRAY, P. Knowledge management. [S.l.]: Taylor & Francis, 1996. Nenhuma citação no texto.
GROTHENDIECK, G. sqldf: Perform SQL Selects on R Data Frames. [S.l.], 2014. R package
version 0.4-10. Disponível em: <http://CRAN.R-project.org/package=sqldf>. Citado na página
50.
GUJARATI, D.; PORTER, D. Econometria Básica - 5.Ed.:. McGraw Hill Brasil, 2011. ISBN
9788580550511. Disponível em: <https://books.google.com.br/books?id=bOLX3aXf6y0C>. Ci-
tado na página 38.
HAMET, P.; TREMBLAY, J. Artificial intelligence in medicine. Metabolism, Elsevier, 2017.
Citado na página 16.
HAN, J.; PEI, J.; KAMBER, M. Data mining: concepts and techniques. [S.l.]: Elsevier, 2011.
Nenhuma citação no texto.
HYNDMAN, R.; ATHANASOPOULOS, G. Forecasting: principles and practice:. OTexts,
2014. ISBN 9780987507105. Disponível em: <https://books.google.com.br/books?id=
gDuRBAAAQBAJ>. Citado 5 vezes nas páginas 33, 37, 39, 40 e 41.
HYNDMAN, R. J. fpp: Data for "Forecasting: principles and practice". [S.l.], 2013. R package
version 0.5. Disponível em: <http://CRAN.R-project.org/package=fpp>. Citado na página 50.
HYNDMAN, R. J.; KHANDAKAR, Y. Automatic time series forecasting: the forecast package
for R. Journal of Statistical Software, v. 26, n. 3, p. 1–22, 2008. Disponível em: <http://www.
jstatsoft.org/article/view/v027i03>. Citado na página 49.
INTERFARMA. Balanço das políticas industriais para o setor farmacêutico. Interdoc VOLUME
III, 2012. Citado na página 15.
JOSEPH, A. compareDF: Do a Git Style Diff of the Rows Between Two Dataframes with Similar
Structure. [S.l.], 2016. R package version 1.0.0. Disponível em: <http://CRAN.R-project.org/
package=compareDF>. Citado na página 50.
JUNIOR, W. C. d. S. S. Integração de sistemas de informações em saúde. uma proposta de
solução para a melhoria da qualidade na gestão do sus. 2009. Citado na página 43.
KABACOFF, R. R in Action: Data Analysis and Graphics with R. Manning, 2015. ISBN
9781617291388. Disponível em: <https://books.google.com.br/books?id=aVnanAEACAAJ>.
Citado na página 34.
LAROCCA, R. et al. The effectiveness of knowledge translation strategies used in public health:
a systematic review. BMC public health, BioMed Central, v. 12, n. 1, p. 1, 2012. Citado na
página 44.
LEISCH, F. Sweave, part i: Mixing r and latex. R News, v. 2, n. 3, p. 28–31, 2002. Citado na
página 49.
LEMOS, E. P.; STEINER, M. T. A.; NIEVOLA, J. C. Análise de crédito bancário por meio de re-
des neurais e árvores de decisão: uma aplicação simples de data mining. Revista de Administração,
v. 40, n. 3, p. 225–234, 2005. Citado na página 25.
LIEBOWITZ, J.; BECKMAN, T. J. Knowledge organizations: What every manager should know.
[S.l.]: CRC Press, 1998. Nenhuma citação no texto.
LIMA, A. C. et al. Datasus: o uso dos sistemas de informação na saúde pública. REFAS-Revista
FATEC Zona Sul, v. 1, n. 3, p. 16–31, 2015. Citado na página 31.
96
http://CRAN.R-project.org/package=sqldf
https://books.google.com.br/books?id=bOLX3aXf6y0C
https://books.google.com.br/books?id=gDuRBAAAQBAJ
https://books.google.com.br/books?id=gDuRBAAAQBAJ
http://CRAN.R-project.org/package=fpp
http://www.jstatsoft.org/article/view/v027i03
http://www.jstatsoft.org/article/view/v027i03
http://CRAN.R-project.org/package=compareDF
http://CRAN.R-project.org/package=compareDF
https://books.google.com.br/books?id=aVnanAEACAAJ
MARCONI, M. d. A.; LAKATOS, E. M. et al. Técnicas de pesquisa. [S.l.]: São Paulo: Atlas,
1999. v. 999. Citado na página 46.
MARTIN, A. C. et al. Análise de séries temporais para previsão da evolução do número de
automóveis no município de joinville. Espacios, v. 37, n. 06, 2016. Citado na página 38.
MARTINS, C. H. F. Ambiente de informações para apoio à decisão dos gestores do controle do
câncer de mama. 2009. Citado na página 42.
MCINERNEY, C. Knowledge management and the dynamic nature of knowledge. Journal of the
American society for Information Science and Technology, Wiley Online Library, v. 53, n. 12, p.
1009–1018, 2002. Nenhuma citação no texto.
MICHALSKI, R. S.; CARBONELL, J. G.; MITCHELL, T. M. Machine learning: An artificial
intelligence approach. [S.l.]: Springer Science & Business Media, 2013. Nenhuma citação no
texto.
MORAIS, R. M. D.; GOMES, E. J.; COSTA, A. L. Os sistemas de informação do sus: Uma
perspectiva histórica e as políticas de informação e informática. Nucleus, v. 11, n. 1, 2014.
Nenhuma citação no texto.
MOYA, J.; SANTOS, E. Pereira dos; MENDONÇA, A. V. M. Gestão do conhecimento em saúde
no brasil: avanços e perspectivas. In: OPS. Seminario sobre Tecnologia, Gestão da Informação e
Conhecimento em Saúde Pública: compartilhando experiéncias. [S.l.], 2009. Citado na página 21.
MURRELL, P. compare: Comparing Objects for Differences. [S.l.], 2015. R package version 0.2-6.
Disponível em: <http://CRAN.R-project.org/package=compare>. Citado na página 50.
NAIR, P.; PRAKASH, K.; ORGANIZATION, A. P. Knowledge Management: Facilitators’
Guide. Asian Productivity Organization, 2009. ISBN 9789283324027. Disponível em: <https:
//books.google.com.br/books?id=zozwZwEACAAJ>. Citado 3 vezes nas páginas 21, 22 e 23.
NONAKA, I. A dynamic theory of organizational knowledge creation. Organization science,
INFORMS, v. 5, n. 1, p. 14–37, 1994. Nenhuma citação no texto.
PATON, C. et al. O uso do"balanced scorecard"como um sistema de gestão estratégica. Revista
de Ciências Jurídicas e Empresariais, v. 1, n. 1, 2015. Nenhuma citação no texto.
PINHEIRO, A. L. S. et al. Health management: The use of information systems and knowledge
sharing for the decision making process. Texto & Contexto-Enfermagem, SciELO Brasil, v. 25,
n. 3, 2016. Nenhuma citação no texto.
PIRES, F. A. etal. Ambiente para extração de informações de saúde a partir de bases de dados
do sus. BIS. Boletim do Instituto de Saúde (Impresso), Instituto de Saúde, v. 13, n. 1, p. 39–45,
2011. Citado na página 43.
PORTA, M. A dictionary of epidemiology. [S.l.]: Oxford University Press, 2008. Citado na
página 38.
PRASS, F. S. Kdd–uma visal geral do processo. 2007. Citado na página 25.
PRODANOV, C. C.; FREITAS, E. C. de. Metodologia do Trabalho Científico: Métodos e Técnicas
da Pesquisa e do Trabalho Acadêmico-2ª Edição. [S.l.]: Editora Feevale, 2013. Citado na página
46.
PROJECT, L. The LaTeX Project Public License. 2017. Disponível em: <http://www.
latex-project.org/lppl.txt>. Acesso em: 23 jan. 2017. Citado na página 49.
97
http://CRAN.R-project.org/package=compare
https://books.google.com.br/books?id=zozwZwEACAAJ
https://books.google.com.br/books?id=zozwZwEACAAJ
http://www.latex-project.org/lppl.txt
http://www.latex-project.org/lppl.txt
QUINN, E. et al. How can knowledge exchange portals assist in knowledge management for
evidence-informed decision making in public health? BMC public health, BioMed Central, v. 14,
n. 1, p. 1, 2014. Citado na página 44.
R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria, 2014.
Disponível em: <http://www.R-project.org/>. Citado na página 48.
R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria, 2014.
Disponível em: <http://www.R-project.org/>. Citado na página 49.
REZENDE, S. O. Sistemas inteligentes: fundamentos e aplicações. [S.l.]: Editora Manole Ltda,
2003. Citado na página 24.
RICHARDSON, R. J.; PERES, J. A. et al. Pesquisa social: métodos e técnicas. [S.l.]: Atlas São
Paulo, 1985. Nenhuma citação no texto.
RUDIS, B. waffle: Create Waffle Chart Visualizations in R. [S.l.], 2015. R package version 0.5.0.
Disponível em: <http://CRAN.R-project.org/package=waffle>. Citado na página 49.
SAMOHYL, R.; SOUZA, G.; MIRANDA, R. de. Métodos simplificados de previsão empresarial.
Ciência Moderna, 2008. ISBN 9788573936667. Disponível em: <https://books.google.com.br/
books?id=CbsnywAACAAJ>. Nenhuma citação no texto.
SAMPAIO, R. F.; MANCINI, M. C. Estudos de revisão sistemática: um guia para síntese
criteriosa da evidência científica. Braz. J. Phys. Ther.(Impr.), v. 11, n. 1, p. 83–89, 2007. Citado
na página 41.
SARKAR, D. Lattice: Multivariate Data Visualization with R. New York: Springer, 2008. ISBN
978-0-387-75968-5. Disponível em: <http://lmdvr.r-forge.r-project.org>. Citado na página 50.
SAÚDE, D. em Ciência da. Biblioteca Virtual em Saúde. 2017. Disponível em: <http://decs.
bvsalud.org/cgi-bin/wxis1660.exe/decsserver/?IsisScript=../cgi-bin/decsserver/decsserver.xis&
interface_language=p&previous_page=homepage&previous_task=NULL&task=start>. Acesso
em: 24 jan. 2017. Citado na página 26.
SAÚDE, M. da. Missão. 2017. Disponível em: <http://portalsaude.saude.gov.br/index.php/
biblioteca/principal/mais-sobre-biblioteca/412-missao>. Acesso em: 24 jan. 2017. Citado na
página 28.
SAÚDE, O. P.-A. da. Avaliação da assistência farmacêutica no Brasil. [S.l.]: Organização Pan-
Americana da Saúde Brasília, 2005. Citado na página 15.
SCHREIBER, G. Knowledge engineering and management: the CommonKADS methodology.
[S.l.]: MIT press, 2000. Nenhuma citação no texto.
SERVIN, G.; BRUN, C. D. Abc of knowledge management. NHS National Library for Health:
Specialist Library, 2005. Citado na página 20.
SILVA, B. M. da; VANDERLINDE, M. Inteligência artificial, aprendizado de máquina. 2012.
Citado na página 26.
SILWATTANANUSARN, T.; TUAMSUK, K. Data mining and its applications for knowledge
management: a literature review from 2007 to 2012. arXiv preprint arXiv:1210.2872, 2012. Citado
na página 24.
SUS, B. M. da Saúde. Secretaria Executiva. Departamento de Informática do. Datasus trajetória
1991-2002 / ministério da saúde, secretaria executiva, departamento de informática do sus. âĂŞ
brasília. 2002. Citado na página 15.
98
http://www.R-project.org/
http://www.R-project.org/
http://CRAN.R-project.org/package=waffle
https://books.google.com.br/books?id=CbsnywAACAAJ
https://books.google.com.br/books?id=CbsnywAACAAJ
http://lmdvr.r-forge.r-project.org
http://decs.bvsalud.org/cgi-bin/wxis1660.exe/decsserver/?IsisScript=../cgi-bin/decsserver/decsserver.xis&interface_language=p&previous_page=homepage&previous_task=NULL&task=start
http://decs.bvsalud.org/cgi-bin/wxis1660.exe/decsserver/?IsisScript=../cgi-bin/decsserver/decsserver.xis&interface_language=p&previous_page=homepage&previous_task=NULL&task=start
http://decs.bvsalud.org/cgi-bin/wxis1660.exe/decsserver/?IsisScript=../cgi-bin/decsserver/decsserver.xis&interface_language=p&previous_page=homepage&previous_task=NULL&task=start
http://portalsaude.saude.gov.br/index.php/biblioteca/principal/mais-sobre-biblioteca/412-missao
http://portalsaude.saude.gov.br/index.php/biblioteca/principal/mais-sobre-biblioteca/412-missao
TABNET: tabulador genérico de domínio público. 2017. Disponível em: <http://www2.datasus.
gov.br/DATASUS/index.php?acao=11&id=32230>. Acesso em: 22 jan. 2017. Citado na página
81.
TAKEUCHI, H.; NONAKA, I. Gestão do conhecimento. [S.l.]: Bookman Editora, 2009. Nenhuma
citação no texto.
TRIOLA, M. Introdução á estatística. LTC, 2008. ISBN 9788521615866. Disponível em: <https:
//books.google.com.br/books?id=paCIPgAACAAJ>. Citado na página 66.
TUOMI, I. Data is more than knowledge: implications of the reversed knowledge hierarchy for
knowledge management and organizational memory. In: IEEE. Systems Sciences, 1999. HICSS-
32. Proceedings of the 32nd Annual Hawaii International Conference on. [S.l.], 1999. p. 12–pp.
Nenhuma citação no texto.
VALENTIM, M. L. P. Gestão da informação e gestão do conhecimento em ambientes organizaci-
onais: conceitos e compreensões. Tendências da Pesquisa Brasileira em Ciência da Informação,
v. 1, n. 1, 2014. Citado na página 30.
WICKHAM, H. ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York, 2009.
ISBN 978-0-387-98140-6. Disponível em: <http://ggplot2.org>. Citado na página 49.
WICKHAM, H. The split-apply-combine strategy for data analysis. Journal of Statistical Software,
v. 40, n. 1, p. 1–29, 2011. Disponível em: <http://www.jstatsoft.org/v40/i01/>. Citado na
página 49.
WIENER, N. Extrapolation, interpolation, and smoothing of stationary time series. [S.l.]: MIT
press Cambridge, 1949. v. 2. Nenhuma citação no texto.
WU, J.-H.; WANG, Y.-M. Measuring kms success: A respecification of the delone and mclean’s
model. Information & Management, Elsevier, v. 43, n. 6, p. 728–739, 2006. Nenhuma citação no
texto.
XIE, Y. knitr: A comprehensive tool for reproducible research in R. In: STODDEN, V.; LEISCH,
F.; PENG, R. D. (Ed.). Implementing Reproducible Computational Research. Chapman and
Hall/CRC, 2014. ISBN 978-1466561595. Disponível em: <http://www.crcpress.com/product/
isbn/9781466561595>. Citado na página 49.
ZAWISLAK, P. A.; FRACASSO, E. M.; TELLO-GAMARRA, J. Intensidade tecnológica e
capacidade de inovação de firmas industriais. Proceedings of the ALTEC, 2013. Citado na página
15.
99
http://www2.datasus.gov.br/DATASUS/index.php?acao=11&id=32230
http://www2.datasus.gov.br/DATASUS/index.php?acao=11&id=32230
https://books.google.com.br/books?id=paCIPgAACAAJ
https://books.google.com.br/books?id=paCIPgAACAAJ
http://ggplot2.org
http://www.jstatsoft.org/v40/i01/
http://www.crcpress.com/product/isbn/9781466561595
http://www.crcpress.com/product/isbn/9781466561595
Apêndices
1 Apêndice I - Tabela com as Morbidades e seus respectivos fármacos que acu-
saram correlação significativa para tempos iguais (Morbidades ocorridas em
Janeiro/2009 comparando com importações ocorridas em Janeiro/2009)
Tabela 24 – Morbidades e Fármacos relacionados
Morbidade/Fármaco Correlação
Cólera
Silicato de potássio 0.766850796059747
Nitrobenzeno 0.787694108118047
Mononitroetano; nitrometanos 0.795949997172857
Guaifenesina 0.728151560593157
Ácido tioglicólico e seus sais 0.811751779757372
Sais de fenciclidina, fenoperidina oufentanil 0.769202105537151
Febres tifóide e paratifóide
Shiguelose
Outros dióxidos de silício -0.713778796427873
Metafosfatos de sódio 0.706100732147242
Outros derivados do ácido quinolinocarboxílico 0.719065775176343
Amebíase
Diarréia e gastroenterite origem infeccpresumível
Outras doenças infecciosas intestinais
Carbonetos de constituição química definida ou não, de cálcio 0.709935693531333
Outros derivados do ácido quinolinocarboxílico 0.724400173556516
Tuberculose pulmonar
Outras tuberculoses respiratórias
Tuberculose do sistema nervoso
Tuberculo semiliar
Restante de outras tuberculoses
Hanseníase[lepra]
Outros tétanos
Difteria
Coqueluche
Carbonetos de constituição química definida ou não, de cálcio -0.710061576431037
Infecção meningocócica
Septicemia
Outros dióxidos de silício 0.789846454716532
1,3-Butilenoglicol (1,3-butanodiol) 0.737810337154748
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.740387761129155
Outros compostos heterocíclicos contendo ciclo pirazina 0.743612531330372
Leptospirose icterohemorrágica
101
Outras formas de leptospirose
Leptospirose não especificada
Restante de outras doenças bacterianas
Outros dióxidos de silício 0.729374781829614
Outros derivados das fenilenodiaminas e seus sais -0.72075864383494
Sífilis congênita
Outros dióxidos de silício 0.76275222519987
Hidróxido de alumínio 0.710372978055426
Outros óxidos de titânio 0.716433148063511
1,3-Butilenoglicol (1,3-butanodiol) 0.779239191379895
Ácido esteárico (ácido monocarboxílico acíclico saturado) 0.719569784314408
Tereftalato de dimetila -0.731491903714778
Outros derivados das fenilenodiaminas e seus sais -0.707417107818071
Outros compostos heterocíclicos contendo ciclo pirazina 0.769089365323905
Sífilis precoce
Outras sífilis
Outros dióxidos de silício 0.702136112987364
Hidróxido de alumínio 0.707784118031844
1,3-Butilenoglicol (1,3-butanodiol) 0.703513686313499
Outras infecções com transm predominant sexual
Outros dióxidos de silício 0.739972800234188
1,3-Butilenoglicol (1,3-butanodiol) 0.713157438239381
Encefaliteviral
1,3-Butilenoglicol (1,3-butanodiol) 0.718043534915795
Dengue[dengue clásssico]
Febre hemorrágica devida ao vírus da dengue
Restante de outr feb rarbovírus febr hemorvírus
Infecções pelo vírus do herpes
Varicela e herpeszoster
Hepatite aguda B
Metafosfatos de sódio 0.705211599136276
Outras hepatites virais
Doença pelo vírus da imuno deficiência humana[HIV]
Caxumba[parotidite epidêmica]
Meningite viral
Restante de outras doenças virais
Outros derivados das fenilenodiaminas e seus sais -0.730252871463747
Micoses
Outros dióxidos de silício -0.712137471124182
Carbonetos de constituição química definida ou não, de cálcio 0.738299836617748
Ácido linoleico e ácido linonênico, seus sais e ésteres 0.703398148548565
Outros derivados das fenilenodiaminas e seus sais 0.751086449029746
Outros compostos heterocíclicos contendo ciclo pirazina -0.751556152630832
102
Malária por Plasmodium falciparum
Outros dióxidos de silício -0.750095319500033
Carbonetos de constituição química definida ou não, de cálcio 0.805612720538129
Ácido linoleico e ácido linonênico, seus sais e ésteres 0.719524493924517
Outros derivados das fenilenodiaminas e seus sais 0.778804719342168
Malária por Plasmodium vivax
Carbonetos de constituição química definida ou não, de cálcio 0.739039039701608
Ácido linoleico e ácido linonênico, seus sais e ésteres 0.718741178066001
Monometilamina 0.743197473093269
Malária não especificada
Outros dióxidos de silício -0.717073498658539
Carbonetos de constituição química definida ou não, de cálcio 0.761245668681777
Ácido linoleico e ácido linonênico, seus sais e ésteres 0.720683475994303
Outros derivados das fenilenodiaminas e seus sais 0.743599801463099
Leishmaniose visceral
Leishmaniose cutânea
Leishmaniose cutâneo-mucosa
Leishmaniose não especificada
Tripanossomíase
Esquistossomose
Filariose
Outras helmintíases
Sequelas de tuberculose
Sequelas de poliomielite
Monóxido de chumbo (litargirio, massicote) 0.73610334580677
Sequelas de hanseníase[lepra]
Outras doenças infecciosas e parasitárias
Outros dióxidos de silício -0.771228215129918
Hidróxido de alumínio -0.703084402065529
Metafosfatos de sódio 0.740269325157052
Carbonetos de constituição química definida ou não, de cálcio 0.749498579482231
Ácido linoleico e ácido linonênico, seus sais e ésteres 0.722851306330169
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais -0.715073567434325
Outros compostos heterocíclicos contendo ciclo pirazina -0.728100353714257
Neoplasia maligna do lábio cavidade oralefaringe
Neoplasia maligna do esôfago
Outros óxidos de titânio 0.705720806893735
Neoplasia maligna do estômago
Outros dióxidos de silício 0.799083325674827
Outros compostos heterocíclicos contendo ciclo pirazina 0.737403194017301
Neoplasia maligna do cólon
Outros dióxidos de silício 0.797779713907787
Hidróxido de alumínio 0.716969937255051
103
Outros óxidos de titânio 0.701052678264095
Carbonetos de constituição química definida ou não, de cálcio -0.735535048857384
1,3-Butilenoglicol (1,3-butanodiol) 0.73076086213646
Ácido linoleico e ácido linonênico, seus sais e ésteres -0.712507909150327
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.747283677987858
Outros derivados das fenilenodiaminas e seus sais -0.728237528865072
Outros compostos heterocíclicos contendo ciclo pirazina 0.745613509049491
Neopl malig junção retossigm reto ânus canal anal
Dióxido de silício tipo aerogel 0.706042936486222
Outros dióxidos de silício 0.784335946501099
Hidróxido de alumínio 0.716970929756987
Metais preciosos no estado coloidal 0.704907611142508
1,3-Butilenoglicol (1,3-butanodiol) 0.709944378632241
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.726658909167272
Outros derivados das fenilenodiaminas e seus sais -0.718885954079599
Outros compostos heterocíclicos contendo ciclo pirazina 0.753956202084299
Neopl malig fígado e vias biliares intra-hepáticas
Outros dióxidos de silício 0.778218751742378
Carbonetos de constituição química definida ou não, de cálcio -0.749249893832166
1,3-Butilenoglicol (1,3-butanodiol) 0.701743949306013
Outros derivados das fenilenodiaminas e seus sais -0.734898348016146
Outros compostos heterocíclicos contendo ciclo pirazina 0.778235949929407
Neoplasia maligna do pâncreas
Outros dióxidos de silício 0.751878895079805
Hidróxido de alumínio 0.728236880182516
Outros óxidos de titânio 0.720959799698331
1,3-Butilenoglicol (1,3-butanodiol) 0.749966630534586
Ácido linoleico e ácido linonênico, seus sais e ésteres -0.706292668331728
Outros derivados das fenilenodiaminas e seus sais -0.731410133411879
Outros compostos heterocíclicos contendo ciclo pirazina 0.794280587713487
Outras neoplasias malignas de órgãos digestivos
Neoplasias malignas de laringe
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.702993875834176
Outros derivados das fenilenodiaminas e seus sais -0.709895766157561
Neoplasiama lig na de traquéia brônquios e pulmões
Outros dióxidos de silício 0.785740964292195
Outros óxidos de titânio 0.707579641826398
1,3-Butilenoglicol (1,3-butanodiol) 0.726916332934846
Outros compostos heterocíclicos contendo ciclo pirazina 0.779999944638412
Outras neopl malig órg respirateintra torácicos
Neoplasia maligna do osso e cartilagem articular
Neoplasia maligna da pele
Outras neoplasias malignas da pele
104
Dióxido de silício tipo aerogel 0.702976743623792
Outros dióxidos de silício 0.773442877396951
Peroxoboratos (perboratos) 0.735241428517018
1,3-Butilenoglicol (1,3-butanodiol) 0.734763020040428
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.740693459490106
Outros compostos heterocíclicos contendo ciclo pirazina 0.726930964487893
Neopl malig do tecido mesoteliale tecidos moles
Dióxido de silício tipo aerogel 0.708785180088199
Outros dióxidos de silício 0.771007729581746
Hidróxido de alumínio 0.709756692383557
Peroxoboratos (perboratos) 0.72755660005113
1,3-Butilenoglicol (1,3-butanodiol) 0.73840620283038
Tereftalato de dimetila -0.717682998262539
N-Fenil-p-fenilenodiamina(4-aminodifenilamina) e seus sais 0.723216620760014
Outros derivados das fenilenodiaminas e seus sais -0.700675409373309
Outros compostos heterocíclicos contendo ciclo pirazina 0.766448819087496
Neoplasia maligna da mama
Outros dióxidos de silício 0.752510853250049
Hidróxido de alumínio 0.718037795152364
1,3-Butilenoglicol (1,3-butanodiol) 0.732481870569237
Outros compostos heterocíclicos contendo ciclo pirazina 0.775119785243848
Neoplasia maligna do colo do útero
Neoplmaligoutrporçõeseporçõesnãoespecútero
Outras neopl malignas órgãos genitais femininos
Neoplasia maligna da próstata
Outros dióxidos de silício 0.764011523742594
Peroxoboratos (perboratos) 0.712450832854787
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.708582706234229
Outros compostos heterocíclicos contendo ciclo pirazina 0.716920319449186
Outras neopl malignas órgãos genitais masculinos
Neoplasia maligna da bexiga
Dióxido de silício tipo aerogel 0.710277466339683
Outros dióxidos de silício 0.777979324160944
Outros óxidos de titânio 0.713799650226527
1,3-Butilenoglicol (1,3-butanodiol) 0.755471502665468
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.712727777284467
Outros compostos heterocíclicos contendo ciclo pirazina 0.757793525085865
Outras neoplasias malignas do trato urinário
Outros dióxidos de silício 0.760497743766554
Peroxoboratos (perboratos) 0.704285329732927
1,3-Butilenoglicol (1,3-butanodiol) 0.751093169005397
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.713019793722226
Outros compostos heterocíclicos contendo ciclo pirazina 0.717362298601356
105
Neoplasia maligna dos olhos e anexos
Neoplasia maligna do encéfalo
Outros dióxidos de silício 0.708606397813256
Neopl malig outras partes sistema nervoso central
Neopl malig outr localiz mal def secun e não espec
Outros dióxidos de silício 0.738833505479243
Peroxoboratos (perboratos) 0.723996709234682
Doençade Hodgkin
Linfomanão-Hodgkin
Outros dióxidos de silício 0.762659594496144
1,3-Butilenoglicol (1,3-butanodiol) 0.703734314587035
Outros compostos heterocíclicos contendo ciclo pirazina 0.718858808694577
Leucemia
Outros dióxidos de silício 0.751483292131292
Hidróxido de alumínio 0.700244188772745
Carbonetos de constituição química definida ou não, de cálcio -0.700451842277912
1,3-Butilenoglicol (1,3-butanodiol) 0.721131446309376
Outros derivados das fenilenodiaminas e seus sais -0.715821274044751
Outros compostos heterocíclicos contendo ciclo pirazina 0.732636407857246
Outras neopl malig tecidos linfóid hematoperelac
Dióxido de silício tipo aerogel 0.7010215823614
Outros dióxidos de silício 0.725578963763458
1,3-Butilenoglicol (1,3-butanodiol) 0.71924992845343
Outros compostos heterocíclicos contendo ciclo pirazina 0.764717331421308
Carcinoma insitu de colo do útero
Hélio líquido (gases raros) 0.762420462190346
Monóxido de chumbo (litargirio, massicote) 0.841127468777194
Carbonatos de lítio -0.730351667648041
Outros monofenóis 0.749381348509379
Neoplasia benigna da pele
Neoplasia benigna da mama
Leiomioma do útero
Neoplasia benigna do ovário
Neoplasia benigna dos órgãos urinários
Neoplbenigencéfaloeoutrpartsistnervcentral
Outr neoplinsitu benig se comportin cert desconh
Anemia por deficiência de ferro
Metafosfatos de sódio 0.740642015136149
Carbonetos de constituição química definida ou não, de cálcio 0.763852320317595
Tetraidrolinalol (3,7-dimetiloctan-3-ol) 0.702707884006314
Outras anemias
Outros dióxidos de silício 0.768684415341393
Afecç hemorrág e outr doenç sangeórg hemato poét
106
Alguns transtornos envolvendo mecanismo imunitário
Transtornos tireoidianos relac deficiência de iodo
Tireotoxicose
Outros transtornos tireoidianos
Diabetes mellitus
Desnutrição
Hidróxido de alumínio -0.726044168926366
Tereftalato de dimetila 0.730917797476984
Obesidade
Outros dióxidos de silício 0.712366487057715
Hidróxido de alumínio 0.709408962592417
Outras n-propilaminas, isopropilaminas e seus sais 0.700142352935997
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.718969366170799
Depleção de volume
Outros derivados das fenilenodiaminas e seus sais 0.702481388456099
Outros transt endócrinos nutricionais metabólicos
Demência
Transt mentais e comportamentais dev uso de álcool
Tetraidrolinalol (3,7-dimetiloctan-3-ol) 0.701081765748649
Outros derivados das fenilenodiaminas e seus sais 0.724445225227476
Outros compostos heterocíclicos contendo ciclo pirazina -0.747427942591622
Transt mentais comport dev uso outr subst psicoat
Esquizofrenia transt esquizo típicos e delirantes
Carbonetos de constituição química definida ou não, de cálcio 0.709240172494659
Outros derivados das fenilenodiaminas e seus sais 0.735461514284663
Outros compostos heterocíclicos contendo ciclo pirazina -0.75410085134301
Transtornos de humor[afetivos]
Transt neuróte relacionados com stress e somatof
Retardomental
Outros transtornos mentais e comportamentais
Meningite bacteriana não classif outra parte
Ortoftalatos de dioctila 0.706361091739818
Outros compostos heterocíclicos contendo ciclo pirrol 0.702940123357546
Mening dev outras causas e causas não especif
Restante doenças inflamat sist nervoso central
Doença de Parkinson
Doença de Alzheimer
Outros compostos heterocíclicos contendo ciclo pirazina 0.706355036936928
Esclerosemúltiplas
Epilepsia
Enxaqueca e outras síndromes de algiascefálicos
Outros dióxidos de silício 0.762374944615576
1,3-Butilenoglicol (1,3-butanodiol) 0.71725706229674
107
Tereftalato de dimetila -0.700010572034902
Outros compostos heterocíclicos contendo ciclo pirazina 0.714210829971284
Acid vascular cerebr isquêm transit e síndr correl
Outros dióxidos de silício -0.753408375714194
Outros compostos heterocíclicos contendo ciclo pirazina -0.742788290499159
Transtornos dos nervos raízes e plexos nervosos
Peroxoboratos (perboratos) 0.713162686304453
Paralisia cerebral e outras síndromes paralíticas
Hidróxido de alumínio 0.70909606415233
Outras doenças do sistema nervoso
Conjuntivite e outros transtornos da conjuntiva
Ceratite e outros transtornos esclerótica e córnea
Catarata e outros transtornos do cristalino
Outros dióxidos de silício 0.705443766967283
Etilenodiamina e seus sais 0.721323902715673
Descolamentos e defeitos da retina
Outros dióxidos de silício 0.708100249863122
Outras n-propilaminas, isopropilaminas e seus sais 0.718437654161252
Etilenodiamina e seus sais 0.72675225125069
Glaucoma
Estrabismo
Transtornos da refração e da acomodação
Outras doenças do olho e anexos
Otite média e outr transt ouvido médio apóf mast
Perda de audição
Outros dióxidos de silício 0.727801971029236
Outras doenças do ouvido e da apófise mastóide
Carbonetos de constituição química definida ou não, de cálcio 0.721811649305823
Febre reumática aguda
Doença reumática crônica do coração
Hipertensão essencial(primária)
Outros dióxidos de silício -0.72618974902467
Carbonetos de constituição química definida ou não, de cálcio 0.713365070684025
Outros derivados das fenilenodiaminas e seus sais 0.721678703348739
Outros compostos heterocíclicos contendo ciclo pirazina -0.74858474706308
Outras doenças hipertensivas
Carbonetos de constituição química definida ou não, de cálcio 0.703911927961536
Tetraidrolinalol (3,7-dimetiloctan-3-ol) 0.714230779216513
Outros compostos heterocíclicos contendo ciclo pirazina -0.707627988920577
Infarto agudo do miocárdio
Dióxido de silício tipo aerogel 0.72360346763115
Outros dióxidos de silício 0.783547650946695
Peroxoboratos (perboratos) 0.728437193287679
108
Metais preciosos no estado coloidal 0.702370224361481
1,3-Butilenoglicol (1,3-butanodiol) 0.733397378567321
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.70509028609429
Outros compostos heterocíclicos contendo ciclo pirazina 0.731411766395308
Outras doenças isquêmicas do coração
Outras n-propilaminas, isopropilaminas e seus sais 0.700743601050887
Embolia pulmonar
Outros dióxidos de silício 0.760243309623268
Hidróxido de alumínio 0.706745195027694
1,3-Butilenoglicol (1,3-butanodiol) 0.723863682570595
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) eseus sais 0.725582682970733
Outros compostos heterocíclicos contendo ciclo pirazina 0.726817663750505
Transtornos de condução e arritmias cardíacas
Outros dióxidos de silício 0.744641273410085
1,3-Butilenoglicol (1,3-butanodiol) 0.700830819460818
Insuficiência cardíaca
Outras doenças do coração
Hemorragia intra craniana
Tetraidrolinalol (3,7-dimetiloctan-3-ol) 0.705847513136906
Ácido linoleico e ácido linonênico, seus sais e ésteres 0.720252025873571
Outros derivados das fenilenodiaminas e seus sais 0.717144924061928
Outros compostos heterocíclicos contendo ciclo pirazina -0.758717432974355
Infarto cerebral
Acid vascular cerebr não espec hemorrág ou isquêm
Dióxido de silício tipo aerogel 0.712578767130398
Outros dióxidos de silício 0.771259250362002
Peroxoboratos (perboratos) 0.70264771885303
1,3-Butilenoglicol (1,3-butanodiol) 0.732138801342644
Outras n-propilaminas, isopropilaminas e seus sais 0.735873827816657
Etilenodiamina e seus sais 0.711939986937614
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.738192836929673
Outros compostos heterocíclicos contendo ciclo pirazina 0.721860729416841
Outras doenças cerebro vasculares
Arteroesclerose
Dicloreto de paraquat 0.775540053423861
Outros compostos heterocíclicos contendo ciclo triazol 0.711311714318233
Outras doenças vasculares periféricas
Embolia e trombose arteriais
Etilenodiamina e seus sais 0.72194001716846
Dicloreto de paraquat 0.709516067728856
Outros compostos heterocíclicos contendo ciclo triazol 0.712000712146521
Outras doenças das artérias arteríolas e capilares
Flebit e trombo flebit e embolia e trombose venosa
109
Metafosfatos de sódio -0.700950498841248
Veias varicosas das extremidades inferiores
Hemorróidas
Outras doenças do aparelho circulatório
Faringite aguda e amigdalite aguda
Outros dióxidos de silício 0.810990440837544
Outros compostos heterocíclicos contendo ciclo pirazina 0.745955793731455
Laringite e traqueíte agudas
Outras infecções agudas das vias aéreas superiores
Influenza[gripe]
Pneumonia
Bronquite aguda e bronquiolite aguda
Sinusite crônica
Outras n-propilaminas, isopropilaminas e seus sais 0.715212026607563
Outras doenças do nariz e dos seios paranasais
Doençascrônicasdasamígdalasedasadenóides
Outras doenças do trato respiratório superior
Carbonetos de constituição química definida ou não, de cálcio 0.708835009394722
Tetraidrolinalol (3,7-dimetiloctan-3-ol) 0.700938049231473
Outros compostos heterocíclicos contendo ciclo pirazina -0.753315836407763
Monensina sódica 0.709821385648371
Bronquite enfisema e outr doenç pulmobstr crônic
Asma
Bronquiectasia
Pneumoconiose
Outras doenças do aparelho respiratório
Outros transtornos dentes e estruturas de suporte
1,3-Butilenoglicol (1,3-butanodiol) 0.706714403508803
Outr doenç cavidade oral glând saliv e maxilares
Úlcera gástrica e duodenal
Outros dióxidos de silício -0.730843084022606
Metafosfatos de sódio 0.746058998882214
Carbonetos de constituição química definida ou não, de cálcio 0.755378282471246
Tetraidrolinalol (3,7-dimetiloctan-3-ol) 0.70492770045233
Ácido linoleico e ácido linonênico, seus sais e ésteres 0.708480879705009
Outros derivados das fenilenodiaminas e seus sais 0.713192843267921
Outros compostos heterocíclicos contendo ciclo pirazina -0.707128672090493
Gastrite e duodenite
Outros dióxidos de silício -0.753462785242248
Hidróxido de alumínio -0.745931146152995
Carbonetos de constituição química definida ou não, de cálcio 0.788024022369453
Tetraidrolinalol (3,7-dimetiloctan-3-ol) 0.719829337436367
1,3-Butilenoglicol (1,3-butanodiol) -0.701399935102808
110
Ácido linoleico e ácido linonênico, seus sais e ésteres 0.756968450504094
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais -0.710791954993884
Outros derivados das fenilenodiaminas e seus sais 0.735537643689805
Outros compostos heterocíclicos contendo ciclo pirazina -0.742733240334142
Outras doenças do esôfago estômago e duodeno
Doenças do apêndice
Outros dióxidos de silício 0.72808256389321
Outros óxidos de titânio 0.707465849262053
1,3-Butilenoglicol (1,3-butanodiol) 0.704961009897321
Outros compostos heterocíclicos contendo ciclo pirazina 0.735872980667459
Hérnia inguinal
Outras hérnias
Doença de Crohnecolite ulcerativa
Ileoparalítico e obstrução intestinal sem hérnia
Doença diverticul ardo intestino
Outros dióxidos de silício 0.71176230943391
1,3-Butilenoglicol (1,3-butanodiol) 0.714237520606883
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.713736260536113
Outros compostos heterocíclicos contendo ciclo pirazina 0.718807474063163
Outras doenças dos intestinos e peritônio
Outros dióxidos de silício 0.711621045799424
Outros compostos heterocíclicos contendo ciclo pirazina 0.707047170523548
Doença alcoólica do fígado
Outras doenças do fígado
Colelitías e ecolecistite
Pancreatite aguda e outras doenças do pâncreas
Outros dióxidos de silício 0.758221399958556
Outros óxidos de titânio 0.729325217712363
Outros compostos heterocíclicos contendo ciclo pirazina 0.723366877401121
Outras doenças do aparelho digestivo
Outros dióxidos de silício 0.779722203893153
1,3-Butilenoglicol (1,3-butanodiol) 0.702791857939119
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.70334555025382
Outros compostos heterocíclicos contendo ciclo pirazina 0.735501213846865
Infecções da pele e do tecido subcutâneo
Outros dióxidos de silício 0.7411625241153
Outras doenças da pele e do tecido subcutâneo
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.700966869688167
Artrite reumatóide e outr poliartropatias inflamat
Tetraidrolinalol (3,7-dimetiloctan-3-ol) 0.74100100032936
Artrose
Outros dióxidos de silício 0.711798605846792
Hidróxido de alumínio 0.701733628313174
111
1,3-Butilenoglicol (1,3-butanodiol) 0.740698624441632
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.701057628247813
Deformidades adquiridas das articulações
Outros transtronos articulares
Doenças sistêmicas do tecido conjuntivo
Transt discais cervic e outr transt discinter vert
Outras dorsopatias
Outros dióxidos de silício 0.723202412345911
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.70310982523939
Transtornos do tecido mole
Transtornos da densidade e da estrutura ósseas
Osteomielite
Outras doenças sist osteomuscular e tec conjuntivo
Síndrome nefríticas aguda e rapidamente progressiv
Outras doenças glomerulares
Doenças renais túbulo-intersticiais
Outros dióxidos de silício -0.706384670412775
Peroxoboratos (perboratos) -0.70583229646702
Outras n-propilaminas, isopropilaminas e seus sais -0.701150376844209
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais -0.741937535412144
Insuficiência renal
Outros dióxidos de silício 0.790890267854267
Outros óxidos de titânio 0.710935036064267
1,3-Butilenoglicol (1,3-butanodiol) 0.72314561780834
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.745235982782892
Outros compostos heterocíclicos contendo ciclo pirazina 0.724217828365074
Urolitíase
Cistite
Outras doenças do aparelho urinário
Outros dióxidos de silício 0.734230086699466
Outros compostos heterocíclicos contendo ciclo pirazina 0.739908381687433
Hiperplasia da próstata
Outros transtornos da próstata
Outros compostos heterocíclicos contendo ciclo pirazina 0.70860498683829
Hidrocele e espermatocele
Preprúcio redundante fimose e parafimose
Outras doenças dos órgãos genitais masculinos
Transtornos da mama
Salpingite e ooforite
Carbonetos de constituição química definida ou não, de cálcio 0.739098435763756
Outros derivados das fenilenodiaminas e seus sais 0.765096434855774
Doença inflamatória do colo do útero
Outras doenças inflamat órgãos pélvicos femininos
112
Endometriose
Prolapso genital feminino
Carbonetos de constituição química definida ou não, de cálcio 0.754495352108432
Outros derivados das fenilenodiaminas e seus sais 0.740560985816604
Transt não-inflam ovário tromp Falópio ligam largo
Transtornos da menstruação
Transt menopáu sicose outr transt perimeno páusicos
Infertilidade feminina
Outros transtornos do aparelho geniturinário
Aborto espontâneoCarbonetos de constituição química definida ou não, de cálcio 0.732945860141341
Ácido linoleico e ácido linonênico, seus sais e ésteres 0.702966618140235
Aborto por razões médicas
Outras gravidezes que terminam em aborto
Edema protein transt hipertens gravid parto puerp
Placent prév descol premat placent hemorrante part
Monóxido de chumbo (litargirio, massicote) 0.715804534432032
Outr motass à mãe rel cav fetal amn pos prob part
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.710058448089307
Trabalho de parto obstruído
Hemorragia pós-parto
Outras complicações da gravidez e do parto
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.755666821951321
Parto único espontâneo
Compl predrelpuerpério e outra fecç obstétr NCOP
Outros dióxidos de silício 0.784876589412932
Outros óxidos de titânio 0.703299182183657
1,3-Butilenoglicol (1,3-butanodiol) 0.739398997777217
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.708231163425679
Outros derivados das fenilenodiaminas e seus sais -0.724449938746392
Outros compostos heterocíclicos contendo ciclo pirazina 0.76497080342259
Feto erec-nascafet fat mat e compl grave parto
Ret cresfet desnfet tranrel gest curt baix peso
Trauma durante o nascimento
Hipóxia intrauterina e asfixia ao nascer
Outros transt respiratórios orig período perinatal
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.712494630546802
Doenças infecciosas e parasitárias congênitas
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.728963627756556
Outras infecções específicas do período perinatal
Doença hemolíticado feto e do recém-nascido
Outras afecções originadas no período perinatal
Dióxido de silício tipo aerogel 0.709435493739726
113
Outros dióxidos de silício 0.769786861816537
Outros óxidos de titânio 0.744444841470424
1,3-Butilenoglicol (1,3-butanodiol) 0.741281292895941
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.723382806941612
Outros derivados das fenilenodiaminas e seus sais -0.727199830490301
Outros compostos heterocíclicos contendo ciclo pirazina 0.749138396614989
Espinhabífida
Outras mal formações congênitas do sistema nervoso
Mal formações congênitas do aparelho circulatório
Fenda labial e fenda palatina
Outras malformações congênitas aparelho digestivo
Testiculo não-descido
Outras mal formações do aparelho geniturinário
Deformidades congênitas do quadril
Deformidades congênitas dos pés
Outr mal form e de form congênita parelho osteomusc
Outras mal formações congênitas
Anomalias cromossômicas NCOP
Dor abdominal e pélvica
Etilenoglicol (etanodiol) 0.715869397926342
Ácido esteárico (ácido monocarboxílico acíclico saturado) 0.711548256226866
Febre de origem desconhecida
Outr sist sinais achada norm ex clín laborat NCOP
Fratura do crânio e dos ossos da face
Fratura do pescoço tórax ou pelve
Fratura do fêmur
Dióxido de silício tipo aerogel 0.702473096988602
Peroxoboratos (perboratos) 0.721241862030042
1,3-Butilenoglicol (1,3-butanodiol) 0.716115057062373
Outras n-propilaminas, isopropilaminas e seus sais 0.717996957710587
Fratura de outros ossos dos membros
Dióxido de silício tipo aerogel 0.714740468464574
Outros dióxidos de silício 0.768308411531882
1,3-Butilenoglicol (1,3-butanodiol) 0.74861774674615
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.705773201439578
Outros compostos heterocíclicos contendo ciclo pirazina 0.773134585639937
Fraturas envolvendo múltiplas regiões do corpo
Outros dióxidos de silício 0.768333010202221
Hidróxido de alumínio 0.700257052079993
Metafosfatos de sódio -0.735286932794756
Carbonetos de constituição química definida ou não, de cálcio -0.721979121612481
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.733487416325306
Outros derivados das fenilenodiaminas e seus sais -0.713408935787566
114
Acrilonitrila 0.701264447254318
Outros compostos heterocíclicos contendo ciclo pirazina 0.75585759023118
Luxações entorse distensão regespe múltipcorpo
Outros dióxidos de silício 0.720893656861894
Peroxoboratos (perboratos) 0.734884467085818
Outras n-propilaminas, isopropilaminas e seus sais 0.729329147473457
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.702116403145793
Acrilonitrila 0.7063194588063
Outros compostos heterocíclicos contendo ciclo pirazina 0.725453271949407
Traumatismo do olho e da órbita ocular
Outros dióxidos de silício 0.7147746852967
Traumatismo intra craniano
Traumatismo de outros órgãos internos
Outros compostos heterocíclicos contendo ciclo pirazina 0.701446635741662
Lesões esmagam put traumát regesp e múltip corpo
Outras n-propilaminas, isopropilaminas e seus sais 0.723037835096727
Etilenodiamina e seus sais 0.719387011509364
Outr traum reg espec não espec e múltiplas corpo
Outros dióxidos de silício 0.757924873327783
Metafosfatos de sódio -0.710390106095869
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.707257088198903
Acrilonitrila 0.71714629703323
Outros compostos heterocíclicos contendo ciclo pirazina 0.738595874398344
Efeitos corpo e tranho através de orifício natural
Outros dióxidos de silício 0.79340540886805
Outros óxidos de titânio 0.711437453980641
1,3-Butilenoglicol (1,3-butanodiol) 0.747710355833667
Outros compostos heterocíclicos contendo ciclo pirazina 0.806280869869648
Queimadura e corrosões
Anticoncepção
Rastreamento pré-natal e outr superv da gravidez
Nascidos vivos segundo o local de nascimento
Assistência e exame pós-natal
Pessoas contato serv saúde cuidados proc específ
Dióxido de silício tipo aerogel 0.701766236315796
Outros dióxidos de silício 0.767440531826298
1,3-Butilenoglicol (1,3-butanodiol) 0.714363317783298
Outros compostos heterocíclicos contendo ciclo pirazina 0.740765121311925
Pessoas contato serv saúde por outras razões
115
2 Apêndice II - Tabela com as Morbidades e seus respectivos fármacos que
acusaram correlação significativa para tempos diferentes (Morbidades ocor-
ridas em Junho/2009 comparando com importações ocorridas em Janeiro/2009)
Tabela 25 – Morbidades e Fármacos relacionados
Morbidade/Fármaco Correlação
Cólera
Hélio líquido (gases raros) 0.792250496098353
Monóxido de chumbo (litargirio, massicote) 0.790393688390836
Metafosfatos de sódio 0.774528456067168
Carbonatos de litio -0.764064206713899
Outros monofenóis 0.703509273964685
Febres tifóide e paratifóide
Shiguelose
Carbonatos de litio -0.702097872954723
Amebíase
Diarréia e gastroenterite origem infeccpresumível
Outras doenças infecciosas intestinais
Tuberculose pulmonar
Outras tuberculoses respiratórias
Tuberculose do sistema nervoso
Tuberculo semiliar
Restante de outras tuberculoses
Hanseníase[lepra]
Outros tétanos
Difteria
Coqueluche
Infecção meningocócica
Outros compostos heterocíclicos contendo ciclo pirazina -0.736954557340776
Septicemia
Outros dióxidos de silício 0.799761913516835
Outros óxidos de titânio 0.72093470689905
1,3-Butilenoglicol (1,3-butanodiol) 0.726696048999545
Outros derivados das fenilenodiaminas e seus sais -0.718035365752715
Outros compostos heterocíclicos contendo ciclo pirazina 0.786643326417911
Leptospirose icterohemorrágica
Outras formas de leptospirose
Leptospirose não especificada
Restante de outras doenças bacterianas
Dióxido de silício tipo aerogel 0.714924300661473
116
Outros dióxidos de silício 0.742681676018011
Hidróxido de alumínio 0.701081278029287
1,3-Butilenoglicol (1,3-butanodiol) 0.709766204413639
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.71712974344874
Outros compostos heterocíclicos contendo ciclo pirazina 0.716933948250447
Sífilis congênita
Outros dióxidos de silício 0.759229714916453
1,3-Butilenoglicol (1,3-butanodiol) 0.732295996155461
Outros derivados das fenilenodiaminas e seus sais -0.734168553072651
Outros compostos heterocíclicos contendo ciclo pirazina 0.809015643596039
Sífilis precoce
Outros compostos heterocíclicos contendo ciclo pirazina 0.722626843710347
Outras sífilis
Outros dióxidos de silício 0.728607477296779
Outros compostos heterocíclicos contendo ciclo pirazina 0.7462734227299
Outras infecções com transm predominantsexual
Encefaliteviral
Outros dióxidos de silício 0.705379923276762
Outros derivados das fenilenodiaminas e seus sais -0.710808989425751
Outros compostos heterocíclicos contendo ciclo pirazina 0.764556900962169
Dengue[dengue clásssico]
Febre hemorrágica devida ao vírus da dengue
Restante de outr feb rarbovírus febr hemorvírus
Outros derivados sulfonados dos hidrocarbonetos, sais, etc. 0.718555205112883
Peróxido de benzoila 0.845209299138227
Infecções pelo vírus do herpes
Varicela e herpeszoster
Hepatite aguda B
Outras hepatites virais
1,3-Butilenoglicol (1,3-butanodiol) -0.702226089247665
Ácido esteárico (ácido monocarboxílico acíclico saturado) -0.724482860293567
Outros compostos heterocíclicos contendo ciclo pirazina -0.716211265536936
Doença pelo vírus da imuno deficiência humana[HIV]
Caxumba[parotidite epidêmica]
Meningite viral
Restante de outras doenças virais
Outros dióxidos de silício 0.73023733185779
Micoses
Carbonetos de constituição química definida ou não, de cálcio 0.715257304542122
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais -0.743268839230709
Outros derivados das fenilenodiaminas e seus sais 0.719784783026901
Malária por Plasmodium falciparum
Metafosfatos de sódio 0.773626304911637
117
Acrilonitrila -0.708599830791349
Malária por Plasmodium vivax
Carbonetos de constituição química definida ou não, de cálcio 0.763912263022182
Ácido linoleico e ácido linonênico, seus sais e ésteres 0.726205590310289
Malária não especificada
Metafosfatos de sódio 0.747764685117616
Acrilonitrila -0.706356132286516
Leishmaniose visceral
Leishmaniose cutânea
Leishmaniose cutâneo-mucosa
Leishmaniose não especificada
Tripanossomíase
Esquistossomose
Filariose
Outras helmintíases
Seqüelas de tuberculose
Seqüelas de poliomielite
Seqüelas de hanseníase[lepra]
Outras doenças infecciosas e parasitárias
Outros dióxidos de silício -0.738268605885881
Metafosfatos de sódio 0.712053546504531
Carbonetos de constituição química definida ou não, de cálcio 0.73084727541567
Outros compostos heterocíclicos contendo ciclo pirazina -0.713228087929777
Neoplasia maligna do lábio cavidade oralefaringe
Neoplasia maligna do esôfago
Neoplasia maligna do estômago
Outros dióxidos de silício 0.735272384683504
Carbonetos de constituição química definida ou não, de cálcio -0.705201425582235
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.725248692865416
Outros derivados das fenilenodiaminas e seus sais -0.74435961629818
Outros compostos heterocíclicos contendo ciclo pirazina 0.732715294847455
Neoplasia maligna do cólon
Outros dióxidos de silício 0.764641550763938
Outros óxidos de titânio 0.703700276770272
Metafosfatos de sódio -0.721936899548618
Carbonetos de constituição química definida ou não, de cálcio -0.744416286371157
Outros derivados das fenilenodiaminas e seus sais -0.715731183562849
Outros compostos heterocíclicos contendo ciclo pirazina 0.748236189016462
Neopl malig junção retossigm reto ânus canal anal
Outros dióxidos de silício 0.734661195952998
Outros óxidos de titânio 0.711655530710193
Carbonetos de constituição química definida ou não, de cálcio -0.742036187811798
Outros derivados das fenilenodiaminas e seus sais -0.746126302901946
118
Outros compostos heterocíclicos contendo ciclo pirazina 0.741313109110773
Neopl malig fígado e vias biliares intra-hepáticas
Outros dióxidos de silício 0.772269437922964
Hidróxido de alumínio 0.720960012728957
Carbonetos de constituição química definida ou não, de cálcio -0.764580533980063
Ácido linoleico e ácido linonênico, seus sais e ésteres -0.725110045379416
Outros derivados das fenilenodiaminas e seus sais -0.708434650924667
Outros compostos heterocíclicos contendo ciclo pirazina 0.713325467476665
Neoplasia maligna do pâncreas
Outros dióxidos de silício 0.751433266619056
Hidróxido de alumínio 0.737295830568493
Outros óxidos de titânio 0.723091113999479
Carbonetos de constituição química definida ou não, de cálcio -0.745653539184363
Tetraidrolinalol (3,7-dimetiloctan-3-ol) -0.701740994152176
1,3-Butilenoglicol (1,3-butanodiol) 0.762385943898271
Ácido linoleico e ácido linonênico, seus sais e ésteres -0.718966048911154
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.701755828383412
Outros derivados das fenilenodiaminas e seus sais -0.735984369502196
Outros compostos heterocíclicos contendo ciclo pirazina 0.804083512133736
Outras neoplasias malignas de órgãos digestivos
Neoplasias malignas de laringe
Neoplasiama lig na de traquéia brônquios e pulmões
Outros dióxidos de silício 0.769274918506428
Hidróxido de alumínio 0.708305197258506
Carbonetos de constituição química definida ou não, de cálcio -0.729790820115043
1,3-Butilenoglicol (1,3-butanodiol) 0.702635432395751
Outros derivados das fenilenodiaminas e seus sais -0.740560418518005
Outros compostos heterocíclicos contendo ciclo pirazina 0.737796999094477
Outras neopl malig órg respirateintra torácicos
Neoplasia maligna do osso e cartilagem articular
Neoplasia maligna da pele
Outras neoplasias malignas da pele
Outros dióxidos de silício 0.74439870014891
Outros derivados das fenilenodiaminas e seus sais -0.706336012577753
Outros compostos heterocíclicos contendo ciclo pirazina 0.756986316990135
Neopl malig do tecido mesoteliale tecidos moles
Outros derivados das fenilenodiaminas e seus sais -0.78561694335455
Outros compostos heterocíclicos contendo ciclo pirazina 0.730716456390618
Neoplasia maligna da mama
Outros dióxidos de silício 0.71323066738872
Carbonetos de constituição química definida ou não, de cálcio -0.730124465960306
Outros derivados das fenilenodiaminas e seus sais -0.74185319813346
Outros compostos heterocíclicos contendo ciclo pirazina 0.716779068924795
119
Neoplasia maligna do colo do útero
Neopl malig outr porções e porções não espec útero
Outras neopl malignas órgãos genitais femininos
Outros derivados das fenilenodiaminas e seus sais -0.737461079774023
Neoplasia maligna da próstata
Outras neopl malignas órgãos genitais masculinos
Neoplasia maligna da bexiga
Outros dióxidos de silício 0.719860444923897
Carbonetos de constituição química definida ou não, de cálcio -0.70941272079822
Outros derivados das fenilenodiaminas e seus sais -0.746290432470397
Outros compostos heterocíclicos contendo ciclo pirazina 0.750236932030041
Outras neoplasias malignas do trato urinário
Outros dióxidos de silício 0.72966196837319
Outros óxidos de titânio 0.706560117886312
1,3-Butilenoglicol (1,3-butanodiol) 0.701328906666384
Outros derivados das fenilenodiaminas e seus sais -0.707366779336594
Outros compostos heterocíclicos contendo ciclo pirazina 0.765331487750296
Neoplasia maligna dos olhos e anexos
Neoplasia maligna do encéfalo
Neopl malig outras partes sistema nervoso central
Neopl malig outr localiz mal def secun e não espec
Doençade Hodgkin
Linfomanão-Hodgkin
Outros compostos heterocíclicos contendo ciclo pirazina 0.706746182830704
Leucemia
Outros dióxidos de silício 0.76146710120871
Carbonetos de constituição química definida ou não, de cálcio -0.721415502046196
1,3-Butilenoglicol (1,3-butanodiol) 0.730024935020569
Outros compostos heterocíclicos contendo ciclo pirazina 0.754433564295092
Outras neopl malig tecidos linfóid hematoperelac
Outros derivados das fenilenodiaminas e seus sais -0.717556326267523
Outros compostos heterocíclicos contendo ciclo pirazina 0.716758298371204
Carcinoma insitu de colo do útero
Neoplasia benigna da pele
Neoplasia benigna da mama
Leiomioma do útero
Neoplasia benigna do ovário
Neoplasia benigna dos órgãos urinários
Neoplbenigencéfaloeoutrpartsistnervcentral
Outr neoplinsitu benig se comportin cert desconh
Anemia por deficiência de ferro
Outras anemias
Outros dióxidos de silício 0.733147015136549
120
Hidróxido de alumínio 0.700064493968314
Outros óxidos de titânio 0.701176240698091
Afecç hemorrág e outr doenç sangeórg hemato poét
Alguns transtornos envolvendo mecanismo imunitário
Transtornos tireoidianos relac deficiência de iodo
Tireotoxicose
Outros transtornos tireoidianos
Diabetes mellitus
Desnutrição
Outros compostos heterocíclicos contendociclo pirazina -0.715182558746677
Obesidade
Depleção de volume
Outros transt endócrinos nutricionais metabólicos
Demência
Transt mentais e comportamentais dev uso de álcool
Outros dióxidos de silício -0.745168586154372
Outros óxidos de titânio -0.715847608869865
Outros polifosfatos 0.706970867171256
Carbonetos de constituição química definida ou não, de cálcio 0.712105676593785
Tetraidrolinalol (3,7-dimetiloctan-3-ol) 0.711083408846485
1,3-Butilenoglicol (1,3-butanodiol) -0.706629073353508
Ácido linoleico e ácido linonênico, seus sais e ésteres 0.769753974812621
Monometilamina 0.705749249778396
Outros compostos heterocíclicos contendo ciclo pirazina -0.758929112132764
Transt mentais comport dev uso outr subst psicoat
Esquizofrenia transt esquizo típicos e delirantes
Outros dióxidos de silício -0.767132643461053
Ácido linoleico e ácido linonênico, seus sais e ésteres 0.749675813317786
Outros compostos heterocíclicos contendo ciclo pirazina -0.764244231195244
Transtornos de humor[afetivos]
Ácido linoleico e ácido linonênico, seus sais e ésteres 0.77875933584618
Transt neuróte relacionados com stress e somatof
Ácido linoleico e ácido linonênico, seus sais e ésteres 0.719658235614856
Retardomental
Outros transtornos mentais e comportamentais
Meningite bacteriana não classif outra parte
Tereftalato de dimetila -0.722375348863273
Outros compostos heterocíclicos contendo ciclo pirazina 0.738318431256148
Mening dev outras causas e causas não especif
Restante doenças inflamat sist nervoso central
Doença de Parkinson
Doença de Alzheimer
Outros compostos heterocíclicos contendo ciclo pirazina 0.705849324683245
121
Esclerosemúltiplas
Epilepsia
Enxaqueca e outras síndromes de algiascefálicos
Outros derivados das fenilenodiaminas e seus sais -0.711760907332992
Acrilonitrila 0.700444551711907
Acid vascular cerebr isquêm transit e síndr correl
Dióxido de silício tipo aerogel -0.719853109379234
Outros derivados das fenilenodiaminas e seus sais 0.773362868053282
Transtornos dos nervos raízes e plexos nervosos
Paralisia cerebral e outras síndromes paralíticas
Outras doenças do sistema nervoso
Conjuntivite e outros transtornos da conjuntiva
Ceratite e outros transtornos esclerótica e córnea
Catarata e outros transtornos do cristalino
Descolamentos e defeitos da retina
Glaucoma
Estrabismo
Transtornos da refração e da acomodação
Outras doenças do olho e anexos
Otite média e outr transt ouvido médio apóf mast
Perda de audição
Outras doenças do ouvido e da apófise mastóide
Carbonetos de constituição química definida ou não, de cálcio 0.748385827613443
Febre reumática aguda
Outros compostos heterocíclicos contendo ciclo pirazina -0.706393264733135
Doença reumática crônica do coração
Hipertensão essencial(primária)
Outros dióxidos de silício -0.743224881496984
1,3-Butilenoglicol (1,3-butanodiol) -0.703532573171457
Outros compostos heterocíclicos contendo ciclo pirazina -0.737024034359995
Outras doenças hipertensivas
Outros dióxidos de silício -0.744944294534767
Outros compostos heterocíclicos contendo ciclo pirazina -0.714389638697347
Infarto agudo do miocárdio
Outros dióxidos de silício 0.75455556378411
Outros derivados das fenilenodiaminas e seus sais -0.710412116434875
Outros compostos heterocíclicos contendo ciclo pirazina 0.745454336773464
Outras doenças isquêmicas do coração
Embolia pulmonar
Outros dióxidos de silício 0.744226169623365
Outros derivados das fenilenodiaminas e seus sais -0.726081329461999
Outros compostos heterocíclicos contendo ciclo pirazina 0.752380859420137
Transtornos de condução e arritmias cardíacas
122
Outros dióxidos de silício 0.721622907931789
Acrilonitrila 0.703644478103083
Insuficiência cardíaca
Peroxoboratos (perboratos) -0.716288309198493
Outras n-propilaminas, isopropilaminas e seus sais -0.725192443119584
Dicloreto de paraquat -0.718252298471568
Outros compostos heterocíclicos contendo ciclo triazol -0.708114618150615
Outras doenças do coração
Hemorragia intra craniana
Hidróxido de alumínio -0.708377308305328
Carbonetos de constituição química definida ou não, de cálcio 0.71429787322037
Ácido linoleico e ácido linonênico, seus sais e ésteres 0.762243852913244
Monometilamina 0.730243863902039
Outras n-propilaminas, isopropilaminas e seus sais -0.752998835116745
Outros compostos heterocíclicos contendo ciclo pirazina -0.721287719752377
Infarto cerebral
Acid vascular cerebr não espec hemorrág ou isquêm
Outros dióxidos de silício 0.710553036920676
Carbonetos de constituição química definida ou não, de cálcio -0.725761054624636
Outros derivados das fenilenodiaminas e seus sais -0.763624079012435
Outros compostos heterocíclicos contendo ciclo pirazina 0.719524493738485
Outras doenças cerebro vasculares
Arteroesclerose
Outras doenças vasculares periféricas
Embolia e trombose arteriais
Outras doenças das artérias arteríolas e capilares
Flebit e trombo flebit e embolia e trombose venosa
Veias varicosas das extremidades inferiores
Hemorróidas
Outras doenças do aparelho circulatório
Faringite aguda e amigdalite aguda
Outros dióxidos de silício 0.704974862818624
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.776377733023842
Outros derivados das fenilenodiaminas e seus sais -0.718814378999717
Acrilonitrila 0.70470631914157
Laringite e traqueíte agudas
Outros dióxidos de silício -0.707044284886365
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais -0.766378262200225
Outras infecções agudas das vias aéreas superiores
Influenza[gripe]
Pneumonia
Bronquite aguda e bronquiolite aguda
Sinusite crônica
123
Outras doenças do nariz e dos seios paranasais
Doençascrônicasdasamígdalasedasadenóides
Outras doenças do trato respiratório superior
Outros dióxidos de silício -0.743956998200324
Carbonetos de constituição química definida ou não, de cálcio 0.704221947490343
Ácido linoleico e ácido linonênico, seus sais e ésteres 0.712188493463951
Outros compostos heterocíclicos contendo ciclo pirazina -0.729571287826349
Bronquite enfisema e outr doenç pulmobstr crônic
Peroxoboratos (perboratos) -0.706388314541835
Asma
Carbonetos de constituição química definida ou não, de cálcio 0.702514478264618
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais -0.741694589470023
Bronquiectasia
Pneumoconiose
Outras doenças do aparelho respiratório
Outros transtornos dentes e estruturas de suporte
Outr doenç cavidade oral glând saliv e maxilares
Úlcera gástrica e duodenal
Outros dióxidos de silício -0.73872552988619
Metafosfatos de sódio 0.721959102611468
Gastrite e duodenite
Outros dióxidos de silício -0.769098125770658
Carbonetos de constituição química definida ou não, de cálcio 0.734992692879914
Ácido linoleico e ácido linonênico, seus sais e ésteres 0.719347226437226
Outros compostos heterocíclicos contendo ciclo pirazina -0.750976893556729
Outras doenças do esôfago estômago e duodeno
Doenças do apêndice
Outros dióxidos de silício 0.70057018557877
Hidróxido de alumínio 0.781184270521683
Outros óxidos de titânio 0.715323474109332
Carbonetos de constituição química definida ou não, de cálcio -0.702121841932786
1,3-Butilenoglicol (1,3-butanodiol) 0.73464608541873
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.70157317995079
Outros compostos heterocíclicos contendo ciclo pirazina 0.723493143606508
Hérnia inguinal
Outras hérnias
Doença de Crohnecolite ulcerativa
Ileoparalítico e obstrução intestinal sem hérnia
Doença diverticul ardo intestino
Outros dióxidos de silício 0.711300657833397
Outros derivados das fenilenodiaminas e seus sais -0.706535248512993
Outros compostos heterocíclicos contendo ciclo pirazina 0.741725325651211
Outras doenças dos intestinos e peritônio
124
Doença alcoólica do fígado
Outras doenças do fígado
Colelitías e ecolecistite
Pancreatite aguda e outras doenças do pâncreas
Dióxido de silício tipo aerogel 0.703491815219165
Outros dióxidos de silício 0.748559822853643
Hidróxido de alumínio 0.719803405963829
Carbonetos de constituição química definida ou não, de cálcio -0.73073245511066
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.761334435641236Outras doenças do aparelho digestivo
Outros dióxidos de silício 0.758820322415327
Infecções da pele e do tecido subcutâneo
Dióxido de silício tipo aerogel 0.713048293887795
Outros dióxidos de silício 0.756783111734292
1,3-Butilenoglicol (1,3-butanodiol) 0.707932543760442
Etilenodiamina e seus sais 0.711450586796305
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.707890966904234
Outras doenças da pele e do tecido subcutâneo
Artrite reumatóide e outr poliartropatias inflamat
Outros dióxidos de silício -0.72621386302337
Outros compostos heterocíclicos contendo ciclo pirazina -0.78421770837317
Artrose
Deformidades adquiridas das articulações
Outros transtronos articulares
Doenças sistêmicas do tecido conjuntivo
Transt discais cervic e outr transt discinter vert
Outras dorsopatias
Transtornos do tecido mole
Transtornos da densidade e da estrutura ósseas
Osteomielite
Outras doenças sist osteomuscular e tec conjuntivo
Síndrome nefríticas aguda e rapidamente progressiv
Outras doenças glomerulares
Doenças renais túbulo-intersticiais
Outros dióxidos de silício -0.727420760044076
:Insuficiência renal
Outros dióxidos de silício 0.762787614902394
Outros óxidos de titânio 0.707519582023276
Carbonetos de constituição química definida ou não, de cálcio -0.731625126425575
1,3-Butilenoglicol (1,3-butanodiol) 0.703939977781419
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.707616370115908
Outros derivados das fenilenodiaminas e seus sais -0.709002190217455
Outros compostos heterocíclicos contendo ciclo pirazina 0.736642131349933
125
Urolitíase
Cistite
Outras doenças do aparelho urinário
Dióxido de silício tipo aerogel 0.718376227031687
Outros dióxidos de silício 0.706303649872096
Hidróxido de alumínio 0.74434186546572
Outras n-propilaminas, isopropilaminas e seus sais 0.710420648204294
Etilenodiamina e seus sais 0.715762448569438
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.755315657668859
Hiperplasia da próstata
Outros transtornos da próstata
Hidrocele e espermatocele
Preprúcio redundante fimose e parafimose
Outras doenças dos órgãos genitais masculinos
Transtornos da mama
Salpingite e ooforite
Hidróxido de alumínio -0.703305454226945
Carbonetos de constituição química definida ou não, de cálcio 0.702280237068263
Tetraidrolinalol (3,7-dimetiloctan-3-ol) 0.700380521041908
:Doença inflamatória do colo do útero
:Outras doenças inflamat órgãos pélvicos femininos
:Endometriose
Outros compostos heterocíclicos contendo ciclo triazol -0.710706335389026
:Prolapso genital feminino
Outros dióxidos de silício -0.70247445390986
Hidróxido de alumínio -0.726497513659314
Tetraidrolinalol (3,7-dimetiloctan-3-ol) 0.702393373105821
Outras n-propilaminas, isopropilaminas e seus sais -0.71461773795164
:Transt não-inflam ovário tromp Falópio ligam largo
Outros compostos heterocíclicos contendo ciclo triazol -0.743345084020795
:Transtornos da menstruação
:Transt menopáu sicose outr transt perimeno páusicos
:Infertilidade feminina
:Outros transtornos do aparelho geniturinário
:Aborto espontâneo
Dicloreto de paraquat -0.757944189922389
:Aborto por razões médicas
:Outras gravidezes que terminam em aborto
:Edema protein transt hipertens gravid parto puerp
:Placent prév descol premat placent hemorrante part
:Outr motass à mãe rel cav fetal amn pos prob part
:Trabalho de parto obstruído
Outros dióxidos de silício -0.73094834258269
126
1,3-Butilenoglicol (1,3-butanodiol) -0.706378483410353
Outros compostos heterocíclicos contendo ciclo pirazina -0.703382828407225
:Hemorragia pós-parto
:Outras complicações da gravidez e do parto
:Parto único espontâneo
:Compl predrelpuerpério e outra fecç obstétr NCOP
Outros dióxidos de silício 0.763911335761483
Outros óxidos de titânio 0.72195585690398
1,3-Butilenoglicol (1,3-butanodiol) 0.744407128387416
Outros derivados das fenilenodiaminas e seus sais -0.713999981095317
Outros compostos heterocíclicos contendo ciclo pirazina 0.789913285233195
:Feto erec-nascafet fat mat e compl grave parto
:Ret cresfet desnfet tranrel gest curt baix peso
:Trauma durante o nascimento
:Hipóxia intrauterina e asfixia ao nascer
:Outros transt respiratórios orig período perinatal
:Doenças infecciosas e parasitárias congênitas
Outros dióxidos de silício 0.740667518498254
1,3-Butilenoglicol (1,3-butanodiol) 0.710994854933418
Colina e seus sais 0.707970277782568
Dicloreto de paraquat 0.701589470552266
Outros compostos heterocíclicos contendo ciclo pirazina 0.788684340419537
:Outras infecções específicas do período perinatal
:Doença hemolíticado feto e do recém-nascido
:Outras afecções originadas no período perinatal
Outros dióxidos de silício 0.74220768142532
Hidróxido de alumínio 0.723203216881188
Outros óxidos de titânio 0.702552830445259
1,3-Butilenoglicol (1,3-butanodiol) 0.735490602185659
Outros derivados das fenilenodiaminas e seus sais -0.702572008077298
Outros compostos heterocíclicos contendo ciclo pirazina 0.798295159701157
:Espinhabífida
:Outras mal formações congênitas do sistema nervoso
:Mal formações congênitas do aparelho circulatório
:Fenda labial e fenda palatina
:Outras malformações congênitas aparelho digestivo
:Testiculo não-descido
:Outras mal formações do aparelho geniturinário
:Deformidades congênitas do quadril
:Deformidades congênitas dos pés
:Outr mal form e de form congênita parelho osteomusc
:Outras mal formações congênitas
Outros compostos heterocíclicos contendo ciclo triazol -0.700023309081156
127
:Anomalias cromossômicas NCOP
:Dor abdominal e pélvica
Outros dióxidos de silício 0.706647190882826
:Febre de origem desconhecida
Outros dióxidos de silício 0.757333154982516
Dicloreto de paraquat 0.714960511411435
:Outr sist sinais achada norm ex clín laborat NCOP
:Fratura do crânio e dos ossos da face
:Fratura do pescoço tórax ou pelve
Outros compostos heterocíclicos contendo ciclo pirazina 0.712599021303892
:Fratura do fêmur
:Fratura de outros ossos dos membros
Outros dióxidos de silício 0.726593847368165
Carbonetos de constituição química definida ou não, de cálcio -0.714371580516071
Outros derivados das fenilenodiaminas e seus sais -0.750859977188823
Outros compostos heterocíclicos contendo ciclo pirazina 0.737350369914205
:Fraturas envolvendo múltiplas regiões do corpo
Outros dióxidos de silício 0.722926964000342
Metafosfatos de sódio -0.741614225999025
Carbonetos de constituição química definida ou não, de cálcio -0.729928595676125
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.73536548314182
Outros compostos heterocíclicos contendo ciclo pirazina 0.718736117436461
:Luxações entorse distensão regespe múltipcorpo
:Traumatismo do olho e da órbita ocular
:Traumatismo intra craniano
:Traumatismo de outros órgãos internos
Hidróxido de alumínio 0.711127820864163
Outras n-propilaminas, isopropilaminas e seus sais 0.71205105607919
:Lesões esmagam put traumát regesp e múltip corpo
:Outr traum reg espec não espec e múltiplas corpo
Outros dióxidos de silício 0.73450592971375
Hidróxido de alumínio 0.720506562335914
Metafosfatos de sódio -0.703083045860591
Carbonetos de constituição química definida ou não, de cálcio -0.731205274888243
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.764461865518254
:Efeitos corpo e tranho através de orifício natural
Outros dióxidos de silício 0.762949327543566
Hidróxido de alumínio 0.701416631506461
Outros óxidos de titânio 0.715912854961449
Carbonetos de constituição química definida ou não, de cálcio -0.73309930071699
1,3-Butilenoglicol (1,3-butanodiol) 0.710143944932649
N-Fenil-p-fenilenodiamina (4-aminodifenilamina) e seus sais 0.712470879441341
Outros derivados das fenilenodiaminas e seus sais -0.712493128463239
128
Outros compostos heterocíclicos contendo ciclo pirazina 0.748836604337835
:Queimadura e corrosões
:Anticoncepção
:Rastreamento pré-natal e outr superv da gravidez
:Nascidos vivos segundo o local de nascimento
:Assistência e exame pós-natal
Outros ésteres tiofosfóricos, sais e derivados 0.700030574289639
:Pessoas contato serv saúde cuidados proc específ
Outros dióxidos de silício0.703956181047613
Outros derivados das fenilenodiaminas e seus sais -0.736040452998091
Outros compostos heterocíclicos contendo ciclo pirazina 0.727128178721322
:Pessoas contato serv saúde por outras razões
6-Hexanolactama (epsilon-caprolactama) -0.773290989692889
3 Apêndice III - Mercadorias com baixa correlação do Capítulo 28
Código Nome Merdadoria Correl Gastos US$
1 28342910 Nitrato de cálcio com teor de
nitrogênio (azoto) inferior ou
igual a 16 % em peso
0.3640 $11,447.00
2 28046100 Silício que contenham em peso
pelo menos 9999 % de silício
0.3993 $32,167.00
3 28372029 Outros ferricianetos 0.5340 $54,107.00
4 28459000 Outros isótopos e seus compos-
tos inorgânicos ou orgânicos
-0.096 $71,731.00
5 28276011 Iodetos de sódio 0.5226 $91,033.00
6 28053010 Liga de cério com teor de ferro
inferior ou igual a 5 % em peso
(Mischmetal)
0.3989 $99,711.00
7 28444090 Outros elementos isótopos e
compostos radioativos etc.
0.3448 $103,340.00
8 28211030 Hidróxidos de ferro 0.3722 $110,153.00
9 28399020 Silicato de alumínio 0.5570 $114,674.00
10 28153000 Peróxidos de sódio ou de po-
tássio
0.3571 $170,112.00
11 28369100 Carbonatos de lítio 0.2756 $202,972.00
12 28042990 Outros gases raros 0.5503 $228,188.00
13 28043000 Nitrogênio (azoto) 0.3526 $811,162.00
129
14 28429000 Outros sais dos ácidos ou pe-
roxoácidos inorgânicos
0.5240 $1,628,228.00
15 28500010 Nitreto de boro 0.4946 $2,386,046.00
16 28444030 Iodo 131 0.3519 $2,697,963.00
17 28041000 Hidrogênio 0.2043 $3,584,420.00
18 28256010 Óxidos de germânio 0.3232 $3,606,519.00
19 28432990 Outros compostos de prata 0.2369 $5,505,930.00
20 28274919 Outros oxicloretos 0.3337 $5,915,163.00
21 28372090 Outros cianetos complexos 0.2941 $5,946,806.00
22 28044000 Oxigênio 0.4016 $6,881,900.00
23 28399090 Outros silicatos 0.3213 $7,062,087.00
24 28371919 Outros cianetos 0.3085 $7,644,524.00
25 28341090 Outros nitritos 0.5262 $9,341,528.00
26 28121019 Outros derivados do cloreto 0.4655 $11,300,348.00
27 28530090 Outros compostos inorgâni-
cos/amálgamas exceto de me-
tais preciosos
0.5607 $11,351,567.00
28 28259090 Óxidos hidróxidos e peróxidos
de outros metais etc.
0.4865 $14,292,136.00
29 28439019 Dexormaplatina; enloplatina;
iproplatina; lobaplatina; mibo-
platina; ormaplatina; sebripla-
tina e zeniplatina apresentadas
de outra forma
0.1602 $15,603,215.00
30 28415012 Cromato de potássio 0.2796 $20,034,521.00
31 28433090 Outros compostos de ouro ex-
clusivamente auranofina etc.
0.0395 $27,571,178.00
32 28112100 Dióxido de carbono 0.2674 $27,606,561.00
33 28444020 Cobalto 60 0.0842 $39,741,789.00
34 28469090 Outros compostos dos metais
das terras raras de ítrio etc.
0.4872 $53,171,645.00
35 28030090 Outras formas de carbono 0.3807 $65,744,968.00
36 28444010 Molibdênio 99 absorvido em
alumina apto para a obtenção
de Tecnécio 99 (reativo de di-
agnóstico para medicina nu-
clear)
-0.005 $71,183,083.00
37 28289011 Hipocloritos de sódio 0.1634 $80,182,089.00
TOTAL $502,085,011,00
Tabela 26 – Correlação menor que 0.561, entre as variáveis
Dólar e Kg das mercadorias do Capítulo
130
4 Apêndice IV - Finalidade das Mercadorias com baixa correlação do Capítulo
28
Nome Merdadoria Finalidade
Iodetos de sódio O iodeto de sódio l-131 é um radiofármaco útil no tratamento
de tireoide hiperreativa e certos cânceres de tireoide.
Isótopos e compostos ra-
dioativos
Auxiliam no diagnóstico, tratamentos e detecção de neopla-
sias.
Hidróxidos de ferro Aplicações em hemoterapia e tratamento de anemia ferro-
priva
Silicato de alumínio adsorvente gastrointestinal (útil para corrigir venenos como
alcalóides e absorver toxinas que produzem diarréia)
Carbonato de Lítio Útil no tratamento de episódios maníacos nos transtornos
bipolares; tratamento de manutenção de indivíduos com
transtorno bipolar, diminuindo a frequência dos episódios
maníacos e a intensidade dos quadros; prevenção da mania
recorrente; prevenção da fase depressiva e tratamento de
hiperatividade psicomotora.
Nitrogênio (azoto) No estado líquido, o nitrogênio atinge temperaturas de até
-196 graus Celsius e é largamente empregado nos processos de
congelamento de sangue e derivados, esperma, medula óssea,
órgãos para transplante e todo tipo de material biológico. Na
criocirurgia, o nitrogênio pode ser usado em procedimentos
simples, como a extirpação de verrugas em dermatologia.
Nitreto de boro Nanopartícula sintetizada denominada nanotubo de nitreto
de boro (BNNT). Alvo de pesquisas em terapia antioneoplá-
sica
Iodo 131 O iodo radioativo I-131, também chamado de radioiodo I-
131, símbolo I, é um isótopo radioativo do iodo. É utilizado
em radioterapia, como técnica auxiliar no tratamento de
câncer da tireoide. Também é utilizado como radiotraçador
em exames de cintilografia.
Dióxido de carbono É utilizado para insuflação em cirurgias pouco invasivas,
como a laparoscopia, endoscopia e artroscopia, bem como
para ampliar e estabilizar cavidades do corpo, possibilitando
uma melhor visualização do campo cirúrgico.
Cobalto 60 Radioisótopo útil como fonte de radiação gama em radiote-
rapia.
131
Molibdênio 99 Rádiofármaco útil para obtenção de Tecnécio 99, utilizado
em imagiografia médica (azul de tecnécio - mapeamento
linfonodal)
Tabela 27 – Finalidade das mercadorias do Capítulo 28 com
correlação menor que 0.561, entre as variáveis
Dólar e Kg
5 Apêndice V - Mercadorias com baixa correlação do Capítulo 29
Código Nome Merdadoria Correl Gastos US$
1 29042010 Mononitrotoluenos (MNT) 0.1377 $3,101.00
2 29242945 Iodamida 0.2306 $17,574.00
3 29042059 Outros derivados nitrados do
benzeno
0.3059 $17,942.00
4 29400012 Arabinose 0.2101 $40,240.00
5 29350091 Cloramina-B e cloramina-T 0.2488 $52,073.00
6 29024200 M-xileno 0.3449 $112,096.00
7 29270030 Compostos azóxicos 0.5640 $129,474.00
8 29335200 Malonilureia (acido barbitú-
rico) e seus sais
0.4882 $158,732.00
9 29182219 Outros sais do ácido o-
acetilsalicílico
0.5218 $260,934.00
10 29081913 p-Clorofenol 0.5076 $266,455.00
11 29362690 Outros derivados da vitamina
B12 não misturados
0.1998 $370,788.00
12 29362959 Outros derivados do ácido ni-
cotínico não misturados
0.5111 $441,686.00
13 29371920 Hcg (gonadotropina corionica) 0.1698 $475,635.00
14 29335400 Outros derivados da manolinu-
reia (ácido barbitúrico)
0.5266 $1,135,485.00
15 29362929 Outras vitaminas d e seus de-
rivados não misturados
0.2596 $1,305,447.00
16 29332991 Imidazol 0.5500 $1,485,601.00
17 29242962 Flutamida 0.3371 $1,627,317.00
18 29221995 Tamoxifen e seu citrato 0.1322 $1,839,109.00
19 29221921 Citrato de orfenadrina 0.3459 $2,018,059.00
20 29121100 Metanal (formaldeído) 0.3855 $2,095,536.00
21 29153942 Acetato de hexenila 0.4984 $2,971,653.00
22 29242939 Outros carbamatos 0.5067 $3,212,385.00
132
23 29224963 Diclofenaco de dietilamônio 0.4313 $3,542,521.00
24 29041060 Ácido benzenossulfônico e seus
sais
0.1470 $3,662,904.00
25 29371950 Oxitocina 0.1284 $3,908,875.00
26 29343030 Prometazina 0.3895 $4,286,599.00
27 29224962 Diclofenaco de potássio 0.0744 $4,730,187.00
28 29213019 Outras cicloexilaminas e seus
sais
0.5718 $4,954,800.00
29 29339947 Ketorolac trometamina 0.5034 $5,971,356.00
30 29362919 Outros derivados da vitamina
b9 não misturados
0.5597 $6,038,280.00
31 29171910 Dioctilsulfossuccinato de sódio 0.3978 $6,890,605.00
32 29222919 O-aminofenóis m-aminofenóis
e seus sais
0.4471 $7,792,010.00
33 29161420 Ésteres de etila do ácido meta-
crílico
0.2961 $8,024,593.00
34 29211929 Outras n-propilaminas isopro-
pilaminas e seus sais
0.4485 $8,467,820.00
35 29335942 Aciclovir 0.3900 $8,759,591.00
36 29362119 Outros derivados da vitamina
A1 álcool não misturados
0.0916 $9,128,827.00
37 29339920 Outros compostos heterocícli-
cos contendo ciclo diazepina
(hidrogenado)
0.0935 $9,327,552.00
38 29121929 Outros monoaldeídos não sa-
turados
0.2415 $9,714,752.00
39 29339122 Diazepam 0.4264 $9,858,813.00
40 29269012 Cloridrato de verapamil 0.5169 $9,987,406.00
41 29350024 Tenoxicam 0.3477 $10,340,681.00
42 29350092 Gliburida 0.0730 $10,555,413.0043 29241929 Outras formamidas e acetami-
das
0.5803 $12,111,059.00
44 29333989 Outros compostos heterocí-
clicos contendo piridina n-
rad.alquila etc
0.1616 $12,424,508.00
45 29223990 Outros aminoaldeídos amino-
cetonas etc.
0.1033 $12,637,725.00
46 29141990 Outras cetonas acíclicas não
contendo outras funções oxige-
nadas
0.4423 $12,878,209.00
47 29339111 Alprazolam 0.0380 $13,280,113.00
48 29302029 Outros ditiocarbamatos 0.5818 $13,864,169.00
133
49 29222100 Ácidos aminonaftolsulfônicos e
seus sais
0.5385 $14,631,663.00
50 29224969 Outros diclofenacos seus sais e
derivados
0.3491 $14,848,499.00
51 29224910 Glicina e seus sais 0.3704 $16,847,144.00
52 29350021 Furosemida 0.5618 $16,891,582.00
53 29362610 Vitamina B12 (cianocobala-
mina) não misturada
0.5442 $17,955,040.00
54 29332929 Outros compostos heterocícli-
cos com ciclo benzeno clorado
0.4208 $19,081,575.00
55 29093029 Outros derivados halogenados
etc dos éteres aromáticos
0.4752 $19,900,134.00
56 29362113 Palmitato de vitamina a1 ál-
cool
0.5357 $20,241,297.00
57 29332919 Outros compostos heterocícli-
cos com 1 ciclo nitroimidazol
0.4607 $20,365,698.00
58 29362190 Outras vitaminas A e seus de-
rivados não misturados
0.2296 $20,690,769.00
59 29334919 Outros derivados do ácido qui-
nolinocarboxílico
0.2610 $21,273,833.00
60 29049090 Outros derivados sulfonados
nitrados etc dos hidrocarbone-
tos
0.3256 $22,252,712.00
61 29222990 Outros aminonaftois aminofe-
nóis seus éteres ésteres sais
0.4645 $23,270,699.00
62 29342090 Outros compostos heterocícli-
cos com ciclos de benzotiazol
0.5008 $26,435,811.00
63 29391900 Outros alcalóides do ópio seus
derivados e sais
0.1105 $26,471,286.00
64 29362931 Vitamina h (biotina) não mis-
turada
0.2048 $26,885,366.00
65 29339946 Maleato de enalapril 0.1943 $27,392,651.00
66 29232000 Lecitinas e outros fosfoamino-
lipidios
0.5738 $27,513,201.00
67 29400019 Outros açúcares quimicamente
puros
0.4172 $27,630,278.00
68 29162019 Outros derivados do ácido ci-
clopropanocarboxílico
0.3351 $27,654,652.00
69 29362911 Vitamina B9 (acido fólico) e
seus sais não misturados
0.2329 $30,693,968.00
70 29339933 Cloridrato de clomipramina 0.5677 $33,376,484.00
71 29214229 Outras cloroanilinas e seus sais 0.4806 $34,256,324.00
134
72 29379090 Outros hormônios prostaglan-
dinas etc.
0.2597 $38,161,495.00
73 29181990 Outros ácidos carboxilicos fun-
ção álcool anidridos etc.
0.4984 $39,389,839.00
74 29375000 Prostaglandinas tromboxanas
e leucotrienos seus derivados e
análogos estruturais
0.3084 $41,799,247.00
75 29419089 Outros polipeptídios e seus
sais
0.1573 $44,470,719.00
76 29343090 Outros compostos heterocícli-
cos com estrutura de ciclo fe-
notiazina
0.3277 $44,868,941.00
77 29399990 Outros alcalóides vegetais na-
turais etc.
-0.045 $48,401,171.00
78 29055990 Outros derivados hidrogena-
dos etc dos alcoóis acíclicos
0.1718 $48,415,515.00
79 29419049 Outros aminoglucosídeos e
seus sais
0.4941 $54,914,012.00
80 29372392 Gestodeno 0.3770 $60,251,713.00
81 29335999 Outros compostos hetero-
cíclicos com ciclo pirimi-
dina/piperazina
0.4186 $66,334,111.00
82 29349949 Outros compostos heterocícli-
cos com heteroátomo de enxo-
fre
0.0590 $72,959,085.00
83 29335939 Outros compostos heterocícli-
cos ciclo pirimidina enxofre
sem halogenado
0.4629 $73,360,525.00
84 29372290 Outros derivados halogenados
dos hormônios corticossupra-
renais
0.5787 $73,619,352.00
85 29183090 Outros ácidos carboxílicos fun-
ção aldeído cetona etc.
0.2588 $75,781,572.00
86 29214990 Outras monoaminas aromáti-
cas seus derivados e seus sais
0.0442 $78,418,979.00
87 29221999 Outros aminoalcoóis seus éte-
res ésteres e sais
0.2917 $78,950,504.00
88 29333946 Omeprazol 0.3980 $79,816,567.00
89 29336999 Outros compostos heterocícli-
cos 1 ciclo triazina não conden-
sado
0.4630 $122,502,582.00
90 29333949 Outros compostos contendo ci-
clo piridina não condensado
0.5320 $125,130,138.00
135
91 29389090 Outros heterosídeos seus sais
éteres ésteres e derivados
0.1413 $130,114,507.00
92 29372399 Outros estrogênios e progesto-
gênios
0.0759 $152,602,773.00
93 29362710 Vitamina C (ácido L- ou DL-
ascórbico) não misturada
0.3311 $156,726,850.00
94 29241999 Outras amidas acíclicas deriva-
dos e sais deste produto
0.2545 $174,625,806.00
95 29419059 Outros macrolídios e seus sais 0.4244 $192,148,351.00
96 29332999 Outros compostos heterocícli-
cos com 1 ciclo de imizadol não
condensado
0.5811 $199,480,262.00
97 29242190 Outras ureínas seus derivados
e sais
0.2212 $214,273,909.00
98 29339939 Outros compostos heterocícli-
cos contendo ciclo azepina
0.0125 $218,059,514.00
99 29189999 Outros ácidos carboxílicos que
contenham funções oxigenadas
suplementares e seus anidridos
0.3114 $223,600,345.00
100 29419099 Outros antibióticos 0.3877 $261,836,361.00
101 29349999 Outros compostos heterocícli-
cos
0.1689 $262,889,633.00
102 29335919 Outros compostos heterocícli-
cos com ciclo piperazina
0.1802 $287,443,519.00
103 29329999 Outros compostos heterocícli-
cos de heteroátomos de oxigê-
nio
0.3250 $575,450,011.00
TOTAL $5,096,535,264.00
Tabela 28 – Correlação menor que 0.5811, entre as variáveis
Dólar e Kg das mercadorias
6 Apêndice VI - Finalidade das Mercadorias com baixa correlação do Capítulo
29
Nome Merdadoria Finalidade
136
Iodamina Droga em estudo, derivada de um fungo. Alguns pesquisa-
dores acreditam que funcione com inibidor da angiogênese,
privando tumores de nutrientes, sendo potencialmente útil
no tratamento de neoplasias.
Arabinose A fludarabina e a citarabina são fármacos úteis no tratamento
de alguns tipos de tumores, principalmente nas leucemias
(mieloide, linfoblástica, promielocitica) e no linfoma de bur-
kit.
Ácido barbitúrico e seus
sais
Os barbiturados são uma classe de medicamentos anticon-
vulsivantes e úteis na indução de de anestesia geral. Ex.:
Fenobarbital, Amobarbital, Butabarbital.
Outros sais do AAS Inibidor irreversível não seletivo da COX; uso como anti-
inflamatório não esteroidal e anti-agregante plaquetário.
Vitamina B12 e seus de-
rivados
Necessária a eritropoiese e formação do sange; previne pro-
blemas cardíacos; útil na manutenção do sistema nervoso.
Derivados do Ácido Ni-
cotinico
Agente anti-hiperlipidêmico
HCG Essencial na fecundação; manutenção do corpo lúteo; alguns
agonistas de HCG são utilizados em tratamentos antineoplá-
sicos (coriocacinoma e cancer de testículo)
Vitaminas D e derivados Útil na manutenção dos níveis de cálcio e fósforo; regula o
metabolismo dos ossos e dentes
Imidazol Composto presente em vários medicamentos antifúngicos, an-
tiprotozoários, anti-hipertensivos, anti-neoplásicos (combate
à leucemia)
Flutamida Fármaco indicado em monoterapia (com ou sem orquiecto-
mia), ou em combinação com um agonista LHRH ("luteining
hormonereleasing hormone"), no tratamento do câncer avan-
çado de próstata em pacientes não tratados previamente ou
em pacientes que não responderam ou se tornaram refratários
à manipulação hormonal.
Tamoxifen Antiestrogênico não esteroidal indicado para o tratamento
do câncer de mama.
137
Citrato de orfenadrina Derivado metilado da difenidramina, é um típico anti-
histamínico antagonista H1, com um moderado efeito seda-
tivo central. Apresenta atividade antagonista dos receptores
muscarínicos M1, M2 e M3 da acetilcolina. Adicionalmente
é um antagonista não competitivo dos receptores NMDA
(N-metil-D-aspartato), os quais desempenham importante
papel no fenômeno da hiperalgesia e sensibilização central.
Esse tríplice mecanismo de ação (anti-histamínico central,
anticolinérgico e antagonista NMDA) confere à orfenadrina
propriedades relaxantes musculares e analgésicas
Diclofenaco de Dieti-
lamômio
Grupo farmacoterapêutico: medicamento tópico para dor nas
articulações e dor muscular. Medicamento anti-inflamatório
tópico, não esteroidal, para uso dermatológico. (ATC M02A
A15). O diclofenaco é um medicamento anti-inflamatório não
esteroidal (AINE), com pronunciadas propriedadesanalgé-
sica, anti-inflamatória e antipirética. A inibição da síntese de
prostaglandinas é o mecanismo de ação primário do diclofe-
naco.
Ketorolac trometamina O trometamol cetorolaco é indicado para alívio dos sinais
e sintomas da conjuntivite alérgica, para tratamento e/ou
profilaxia da inflamação em pacientes que submeteram-se
a cirurgias oculares e cirurgias de extração de catarata e
tratamento da dor ocular
Vitamina B9 O ácido fólico contribui para o normal funcionamento do
sistema imunitário, auxilia a normal função psicológica e
contribui para a redução do cansaço e da fadiga. Participa na
síntese normal dos aminoácidos e no metabolismo normal da
homocisteína. Contribui para o processo de divisão celular
e para o crescimento do tecido materno durante a gravidez.
Tem um papel na formação normal do sangue
Aciclovir Indicado no tratamento de infecções cutâneas pelo vírus
Herpes simplex, incluindo herpes genital e labial, inicial e
recorrente
138
Diazepam Está indicado para alívio sintomático da ansiedade, tensão e
outras queixas somáticas ou psicológicas associadas com a sín-
drome da ansiedade. Pode também ser útil como coadjuvante
no tratamento da ansiedade ou agitação associada a desor-
dens psiquiátricas. O diazepam é útil no alívio do espasmo
muscular reflexo devido a traumas locais (lesão, inflamação).
Pode ser igualmente usado no tratamento da espasticidade
devido à lesão dos interneurônios espinhais e supraespinhais,
tal como ocorre na paralisia cerebral e paraplegia, assim
como na atetose e na síndrome rígida. Os benzodiazepínicos
são indicados apenas para desordens intensas, desabilitantes
ou para dores extremas.
Cloridrato de verapamil Inibidor do influxo de íons cálcio (bloqueador de canais lentos
ou antagonista do íon cálcio). Útil no tratamento de isquemia
miocárdica, HAS leve e moderada, profilaxia das taquicardias
supraventrculares paroxísticas
Tenoxicam Pertence à classe dos anti-inflamatórios não esteroides e apre-
senta propriedades anti-inflamatórias, analgésicas e também
inibidoras da agregação plaquetária
Gliburida A glibenclamida é um antidiabético oral do grupo das sul-
fonilureias, dotado de potente ação hipoglicemiante e ótima
tolerabilidade. Tanto em pessoas saudáveis quanto em pacien-
tes com diabetes mellitus não insulino-dependentes (tipo 2),
a glibenclamida reduz a concentração plasmática de glicose
por meio da estimulação da liberação de insulina pelas células
beta do pâncreas
Alprazolam Ansiolítico (benzodiazepínico) - depressor do SNC, útil no
tratamento de ansiedade, síndrome do pânico, insonia...
Outros diclofenacos Anti-inflamatório não esteroidal
Vitamina h Participa na gliconeogênese; atua na oxidação e síntese de áci-
dos graxos; participa da síntese de purinas; atua na formação
da pele; atua no metabolismo de carboidratis e proteínas.
Maleato de enalapril Indicado para o tratamento de todos os graus de hipertensão
essencial, tratamento da hipertensão renovascular e todos os
graus de insuficiência cardíaca. Em pacientes com insuficiên-
cia cardíaca sintomática, também é indicado para aumentar
a sobrevida, retardar a progressão da insuficiência cardíaca
e reduzir as hospitalizações por insuficiência cardíaca. Além
disso, atua na prevenção de insuficiência sintomática e de
eventos coronarianos isquêmicos.
139
Cloridrato de clomipra-
mina
Antidepressivo tricíclico. Inibidor da recaptação de nora-
drenalina e preferencialmente de serotonina inibidores não
seletivos da recaptação de monoamina.
Tabela 29 – Finalidade das mercadorias que não possuem
correlação significativa - Capítulo
7 Apêndice VII - Mercadorias com baixa correlação do Capítulo 30
Código Nome Merdadoria Correl Gastos US$
1 30061020 Materiais para suturas cirúrgi-
cas de aço inoxidável
0.4906 $895,658.00
2 30044010 Medicamento que contenham
vimblastina; vincristina; deri-
vados destes produtos; topote-
can ou seu cloridrato em doses
0.1707 $4,464,192.00
3 30049021 Medicamentos contendo per-
metrina/nitrato propatila etc
em doses
0.3339 $8,411,344.00
4 30043918 Medicamento contendo tripto-
relina ou seus sais em doses
0.4409 $16,819,226.00
5 30031012 Medicamento contendo amoxi-
cilina ou seus sais, exceto em
doses
0.4955 $17,820,174.00
6 30049067 Medicamento contendo nicar-
bazina/norfloxacina etc em do-
ses
0.4061 $18,617,087.00
7 30042019 Medicamento contendo anfeni-
cóis/outros sais em doses
0.3553 $21,108,858.00
8 CODIGO 28011000 280120 $28,012,090.00
9 30064020 Cimentos para reconstituição
óssea
0.3833 $39,029,070.00
10 30029010 Reagentes de origem microbi-
ana para diagnóstico
0.4828 $44,072,384.00
11 30063019 Outras preparações opacifican-
tes para exames radiológicos
0.4774 $46,786,495.00
140
12 30029091 Outras toxinas culturas de
micro-organismos para saúde
animal
0.4726 $49,578,243.00
13 30021019 Outros antisoros específcos de
animais/pessoas imunizados
-0.078 $50,281,390.00
14 30039099 Outros medicamentos con-
tendo produtos misturados
para fins terapêuticos etc.
0.4915 $53,013,716.00
15 30042069 Outros medicamentos
contendo aminoglucosí-
dios/derivados em doses
0.3400 $63,362,444.00
16 30023070 Vacina veterinária contra as se-
guintes enfermidades: de New-
castle a vírus vivo ou vírus ina-
tivo; de Gumboro a vírus vivo
ou vírus inativo; bronquite a
vírus vivo ou vírus inativo; dif-
teroviruela a vírus vivo; etc.
0.2620 $69,854,827.00
17 30064012 Outros produtos para obtura-
ção dentária
0.3313 $92,171,861.00
18 30032099 Medicamento contendo outros
antibióticos, exceto em doses
-0.003 $108,745,769.00
19 30039079 Medicamentos contendo ou-
tros compostos heterocíclicos
heteroat.nitrogenados, exceto
em doses
0.4113 $131,027,871.00
20 30039089 Medicamento contendo outros
compostos heterocíclicos etc.,
exceto em doses
0.3254 $142,509,624.00
21 30019010 Heparina e seus sais 0.3609 $191,549,858.00
22 30042059 Outros medicamentos con-
tendo cefalosporinas etc. em
dose
0.4613 $199,933,146.00
23 30022026 Vacina contra rubéola sa-
rampo e caxumba em doses
0.3923 $264,716,227.00
24 30042095 Medicamento contendo Anfo-
tericina B em lipossomas doses
venda a retalho
0.0770 $276,654,009.00
25 30049095 Medicamento contendo propo-
fol busulfano mitotano em do-
ses
0.0461 $300,337,476.00
141
26 30045090 Medicamento contendo ou-
tras vitaminas/provitaminas
etc.em doses
0.3366 $414,276,456.00
27 30043999 Outros medicamentos con-
tendo hormônios em doses etc.
0.4564 $508,832,220.00
28 30049078 Medicamento contendo topote-
can uracil tegafur etc em doses
0.2922 $519,600,799.00
29 30042099 Medicamentos contendo ou-
tros antibióticos em doses
0.1374 $570,801,230.00
30 30021036 Interferon beta; peg interferon
alfa-2-a
0.3581 $722,045,427.00
31 30049059 Outros medicamentos con-
tendo produtos das posições
2930 a 2932 etc. em doses
0.3857 $1,080,747,872.00
32 30049039 Outros medicam.c/compostos
de funcao aminaetc.em doses
0.3891 $1,081,302,969.00
33 30049019 Medicamento contendo outras
enzimas em doses
0.2356 $1,324,956,678.00
34 30021029 Outras frações do sangue pro-
dutos imunologicamente modi-
ficado exceto medicamento
0.4216 $1,725,667,523.00
35 30049079 Outros medicamentos com
compostos heterocíclicos etc
em doses
0.4601 $2,388,757,726.00
36 30049099 Outros medicamentos con-
tendo produtos para fins tera-
pêuticos etc doses
-0.215 $2,835,437,296.00
37 30049069 Outros medicamentos con-
tendo compostos heterocíclicos
heteroátomos nitrogenados em
doses
0.4989 $4,637,765,513.00
TOTAL $24,695,450,500.00
Tabela 30 – Tabela correlação entre Dólar e Kg das mercado-
rias menor que 0.51 do Capítulo 30
8 Apêndice VIII - Finalidade das Mercadorias com baixa correlação do Capí-
tulo 30
142
Nome Merdadoria Finalidade
Medicamento que conte-
nha vimblastina; vincris-
tina; topotecan
O sulfato de vincristina pode ser utilizado como quimio-
terapia combinada na leucemia linfoide aguda, Doença de
Hodgkin, linfomas malignos não Hodgkin (tipos linfocíticos,
de células mistas, histiocíticos, não diferenciados, nodula-
rese difusos), rabdomiossarcoma, neuroblastoma, tumor de
Wilms, sarcoma osteogênico, micose fungóide, sarcoma de
Ewing, carcinoma de cervix uterino, câncer de mama, me-
lanoma maligno, carcinoma "oat cell"de pulmão e tumores
ginecológicos de infância. Pacientes com púrpura trombo-
citopênica idiopática verdadeira, resistentes ao tratamento
convencional, podem ser beneficiados com o uso desse medica-
mento. O sulfato de vincristina também poderá ser utilizado
em conjunto com outros medicamentos para o tratamento de
algumas neoplasias pediátricas, tais como: neuroblastoma,
sarcoma osteogênico, sarcoma de Ewing, rabdomiossarcoma,
tumor de Wilms, doença de Hodgkin, linfoma não Hodgkin,
carcinoma embrionário de ovário e rabdomiossarcoma de
útero. O cloridrato de topotecana injetável é indicado para o
tratamento de carcinoma metastático de ovário, após falha da
quimioterapia inicial ou subsequente, e de câncer de pulmão
de pequenas células sensíveis, após falha da quimioterapia
de primeira linha.
Medicamento contendo
permetrina/nitrato pra-
patila
Indicado para o tratamento de pediculose causada por Pedi-
culus humanus va. capitis e seus ovos.
Medicamento contendo
triptorelina
Antineoplásico estimulante das gonadotropinas e acaba su-
primindo a secreção de LH e FSH, resulando em queda da
testosterona e castração farmacológica.
Medicamento contendo
amoxicilina
Antibióticos
Medicamentos con-
tendo nicarba-
zina/norfloxacina
Fármaco utilizado para o combate das coccidiose/tratamento
de algumas infecções.
Medicamentos contendo
anfenicóis
Abrangem cloranfenicol e tianfenicol, antibióticos bacteri-
ostáticos de amplo espectro de atividade, atuando contra
bactérias gram-positivas, gram-negativas, riquétsias, clamí-
dias e micoplasmas.
143
Medicamentos contendo
aminoglucosídios
Os medicamentos desta classe são bactericidas, inibidores
de síntese proteica das bactérias sensíveis. (Eles incluem a
amicacina, arbecacina, gentamicina, canamicina, neomicina,
netilmicina, paromomicina, rodostreptomicina, estreptomi-
cina, tobramicina e apramicina).
Medicamento contendo
outros antibióticos
Antimicrobianos
Heparina e seus sais Tratamento e profilaxia das afecções tromboembólicas de
qualquer etiologia e localização. Profilaxia e terapêutica das
hiperlipidemias.
Medicamentos contendo
cefalosporinas
Classe de antimicrobianos de primeira geração
Medicamento contendo
Anfotericina B em lipos-
somas
O ANFORICIN B contém Anfotericina b, um antibiótico
antifúngico poliênico derivado do Streptomyces nodosus
Medicamento contendo
propofol busulfano mito-
tano
Agente anestésico intravenoso de curta ação, adequado para
indução e manutenção de anestesia geral em procedimentos
cirúrgicos, para a sedação de pacientes adultos ventilados
que estejam recebendo cuidados de terapia intensiva, e para
sedação consciente para procedimentos cirúrgicos e de diag-
nóstico.
Medicamento contendo
topotecan uracil tegafur
Antineoplásico, inibidor da topoisomerase I. Indicação: car-
cinoma metastático de ovário, síndromes mielodisplásicas,
tumores cerebrais.
Interferon beta; peg in-
terferon alfa-2-a
Antineoplásico, agente antiproliferativo, antiviral, agente
imunológico.
Tabela 31 – Finalidade das mercadorias que não possuem cor-
relação significativa - Capítulo 30
144
Anexos
1 Anexo I - Relatório de análise das correlações entre morbidades e mercado-
rias (fármacos), realizada por profissionais da área da saúde
De acordo com os dados obtidos não houveram correlações positivas entre os compostos
e as morbidades. Ademais, os seguintes produtos farmacêuticos encontram-se desvinculados das
patologias descritas para quais poderiam ser utilizados na prática médica:
Mercadoria Finalidade Morbidade associada
Carbonato
de Lítio
Útil no tratamento de episódios ma-
níacos nos transtornos bipolares; tra-
tamento de manutenção de indiví-
duos com transtorno bipolar, dimi-
nuindo a frequência dos episódios
maníacos e a intensidade dos qua-
dros; prevenção da mania recorrente;
prevenção da fase depressiva e tra-
tamento de hiperatividade psicomo-
tora.
- Cólera - Shiguelose
Hidróxido
de Alumínio
Antiácido útil no tratamento de azia
em pacientes com hiperacidez gás-
trica, refluxo ou hérnia de hiato, bem
como tratamento auxiliar das gas-
trites e úlceras gastroduodenais. É
também um dos adjuvantes mais uti-
lizados em vacinas para uso humano
e veterinário.
Restante de outras doenças bacterianas,
Neoplasias malignas de fígado e vias bilia-
res intra-hepáticas, Neoplasias malignas de
pâncreas, Neoplasias malignas de traquéia,
brônquios e pulmões, Outras Anemias, He-
morragia intracraniana, Doenças do apên-
dice, Pancreatite aguda e outras doenças
do pâncreas, Outras doenças do aparelho
urinário, Salpingite e ooforite, Outras afec-
ções originadas no período perinatal, Trau-
matismo de outros órgãos internos, Efeitos
corpo estranho através de orifício natural
eróxido de
Benzoíla
Agente oxidante, com propriedades
antibacterianas e classificado como
ceratolítico. Útil no tratamento tó-
pico de acne vulgar
Restante de outros arbovírus e hemovírus
146
Ácido Lino-
leico
Suplemento alimentar ofertante de
ácidos graxos polinsaturados pro-
posto como responsável por ação an-
tioxidante, melhoria do metabolismo
dos lipídios e insulina, redução da
gordura corporal. No entanto, o Mi-
nistério da Saúde adverte: Não exis-
tem evidências científicas comprova-
das de que este alimento previna,
trate ou cure doenças.
Malária por Plasmodium vivax, Neoplasias
malignas de fígado e vias biliares intra-
hepáticas, Neoplasias malignas de pân-
creas, Hemorragia intracraniana, Transtor-
nos mentais e comportamentais de uso de
álcool, Esquizofrenia, Transtornos de hu-
mor afetivos, Transtornos relacionados com
stress e somatoformes, Outras doenças do
trato respiratório superior, Gastrite e duo-
denite
1,3-
Butilenoglicol
(1,3 butano-
diol)
Presente em grande quantidade de
produtos dermatológicos e cosméti-
cos como excipientes
Septicemia,Restante de outras doenças bac-
terianas, Sífilis congênita, Outras Hepa-
tites Virais, Neoplasias malignas de pân-
creas, Neoplasias malignas de traquéia,
brônquios e pulmões, Outras neoplasias
malignas do trato urinário, Leucemia,
Transtornos mentais e comportamentais de
uso de álcool, Hipertensão essencial (pri-
mária), Doenças do apêndice, Infecções da
pele e do tecido subcutâneo, Doenças re-
nais túbulo-intersticiais, Trabalho de parto
obstruído, Doenças infectoparasitárias con-
gênitas, Outras afecções originadas no pe-
ríodo perinatal e Efeitos corpo estranho
através de orifício natural
Tabela 32 – Produtos farmacêuticos utilizados na prática mé-
dica
Conclui-se, portanto, que as correlações são espúrias.
147
	Folha de rosto
	Folha de aprovação
	Agradecimentos
	Epígrafe
	Resumo
	Abstract
	Lista de ilustrações
	Lista de tabelas
	Lista de abreviaturas e siglas
	Lista de símbolos
	Sumário
	Introdução
	Objetivos
	Justificativa
	Escopo
	Revisão da literatura
	Gestão do Conhecimento
	Captura e Criação do Conhecimento
	Técnicas, Ferramentas e Tecnologias de Apoio à Gestão do Conhecimento
	Knowledge Discovery in Database (KDD)
	Seleção de dados
	Pré-processamento e limpeza
	Transformação dos dados
	Mineração de dados
	Interpretação e avaliação
	Mineração de Dados
	Gestão do Conhecimento em saúde pública no Brasil
	Gestão do Conhecimento no Ministério da Saúde
	Gestão da Informação em Saúde
	Fundamentos Estatísticos e Métodos de previsão
	Método ARIMA(1,1,1)(0,0,1)
	Método da ETS (AAdN)
	Correlação
	Método Estatístico
	Conjuntos de Treinamento e Teste
	Erros residuais
	Séries Temporais
	Tendência
	Sazonalidade
	Multiplicativa e Aditiva
	Ciclos
	Irregularidades
	Estacionariedade
	Revisão Sistemática
	Metodologia
	Delineamento da pesquisa
	Premissas e conceitos de Gestão do Conhecimento e tecnológicos 
	Modelo para solucionar o problema proposto
	Cruzar e analisar as informações nos dois sistemas, DATASUS e ALICEWEB
	Outras considerações, uso do Pacote R e Latex
	Análise e discussão dos resultadosSistema ALICEWeb
	Fase Renomear Tabelas com o padrão capXXYYZZAAAA
	Fase Retirar Cabeçalho
	Fase Listar a Quantidade de Mercadorias das N Tabelas
	Fase Comparar Tabelas com Totais do Capítulo
	Fase Intersecção de Tabelas do Mesmo Ano
	Fase Intersecção de Tabelas de Anos Diferentes
	Fase Formatação dos Campos
	Capítulo 28 do NCM - Produtos químicos inorgânicos, compostos inorgânicos ou orgânicos de metais preciosos, de elementos radioativos, de metais das terras raras ou de isótopos
	Capítulo 29 do NCM - Produtos Químicos Orgânicos
	Capítulo 30 do NCM - Produtos farmacêuticos
	Previsões para o Capítulo 28
	Previsões para o Capítulo 29
	Previsões para o Capítulo 30
	Sistema DATASUS
	Análise e interpretação do cruzamento das informações nos sistemas DATASUS e ALICEWeb
	Considerações Finais
	Conclusão
	Referências
	Apêndices
	Apêndice I - Tabela com as Morbidades e seus respectivos fármacos que acusaram correlação significativa para tempos iguais (Morbidades ocorridas em Janeiro/2009 comparando com importações ocorridas em Janeiro/2009)
	Apêndice II - Tabela com as Morbidades e seus respectivos fármacos que acusaram correlação significativa para tempos diferentes (Morbidades ocorridas em Junho/2009 comparando com importações ocorridas em Janeiro/2009)
	Apêndice III - Mercadorias com baixa correlação do Capítulo 28
	Apêndice IV - Finalidade das Mercadorias com baixa correlação do Capítulo 28
	Apêndice V - Mercadorias com baixa correlação do Capítulo 29
	Apêndice VI - Finalidade das Mercadorias com baixa correlação do Capítulo 29
	Apêndice VII - Mercadorias com baixa correlação do Capítulo 30
	Apêndice VIII - Finalidade das Mercadorias com baixa correlação do Capítulo 30
	Anexos
	Anexo I - Relatório de análise das correlações entre morbidades e mercadorias (fármacos), realizada por profissionais da área da saúde

Mais conteúdos dessa disciplina