Buscar

Ciência de dados e Big Data: implementações e estudos na pandemia de COVID-19

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 17 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 17 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 17 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
 
 
Ciência de dados e Big Data: implementações e estudos na pandemia de COVID-19 
 
João Paulo Ferreira da Silva* 
 
 
Resumo 
 
 
Este artigo tem como objetivo verificar a contribuição da ciência de dados e Big 
Data na pandemia de COVID-19. Utilizando pesquisa bibliográfica, este artigo aborda 
a decisão de países como a China e a Coréia do Sul de criar sistemas baseados em 
ciência de dados e Big Data para monitorar a movimentação do coronavírus causador 
da pandemia de COVID-19 e tomar decisões baseadas nas análises dos dados. 
Também aborda as publicações de pesquisas que utilizaram a ciência de dados e Big 
Data durante a pandemia. Este artigo conclui que mesmo não sendo possível a 
previsão de pandemias no momento, como a da COVID-19, a ciência de dados e Big 
Data têm sido fortes aliados no combate à doença através de ferramentas de análise 
de dados e aprendizagem de máquina, possibilitando tomadas de decisões e até 
simular anticorpos capazes de neutralizar o vírus da COVID-19. 
 
Palavras-chave: Ciência de Dados. Big Data. Pandemia. COVID-19. 
 
 
Introdução 
 
 
Em 2020, o mundo foi acometido de uma doença com uma alta velocidade de 
transmissão. No fim do ano 2019 e início do ano 2020, essa doença tornou-se um 
mistério para diversos cientistas chineses que tentavam descobrir a sua origem (SÁ, 
2020). Semanas depois, foi descoberto que a doença era causada pela mutação de 
um coronavírus batizado de Severe Acute Respiratory Syndrome Coronavirus 2 
(SARS-CoV-2) que em português significa “Coronavírus da Síndrome Respiratória 
Aguda Grave 2” (SÁ, 2020). 
Por causa da alta velocidade de transmissão do SARS-CoV-2, os governos 
viram a necessidade de acompanhar o movimento do vírus em seus países. Para 
analisar uma quantidade enorme de dados das mais variadas fontes e tipos, os 
governos utilizaram tecnologias de Big Data e ciência de dados no monitoramento da 
pandemia e nas tomadas de decisões. 
 
* Pós-graduando em Ciência de Dados e Big Data Analytics na Universidade Estácio de Sá. 
2 
 
Neste contexto, este artigo pretende responder a seguinte questão norteadora: 
de que forma a ciência de dados e Big Data estão ajudando no combate à pandemia 
de COVID-19 no mundo? 
O objetivo que este artigo é apresentar e descrever implementações de 
sistemas e estudos baseados em ciências de dados e Big Data durante a pandemia 
de COVID-19. 
Este artigo é relevante para que se tome conhecimento da contribuição que as 
tecnologias baseadas na ciência de dados e Big Data estão dando no combate à 
pandemia de COVID-19. Com este conhecimento, as organizações podem tomar 
como base as implementações apresentadas neste artigo para desenvolver sistemas 
também baseados em ciência de dados e Big Data que auxiliem no combate à 
pandemia de COVID-19 ou até mesmo à outras doenças que atinjam grandes 
populações. 
Utilizando pesquisa bibliográfica, este artigo buscou, através de mecanismos 
de buscas acadêmicas como o Scielo.org e o Google Scholar, publicações 
relacionadas ao tema. Também foram utilizadas fontes jornalísticas, pois a pandemia 
de COVID-19 é um fato novo na sociedade e, por conta disso, não existem muitos 
trabalhos relacionados. 
Este artigo se inicia com um breve histórico da evolução da pandemia de 
COVID-19, e, logo depois, uma introdução do conceito de ciência de da dados e Big 
Data. Após essas abordagens, serão apresentados quatro sistemas e uma pesquisa 
que utilizam ciência de dados e Big Data no combate à pandemia de COVID-19. 
 
 
1. Breve história da pandemia de COVID-19 
 
 
O primeiro caso registrado de COVID-19 foi na cidade de Wuhan que fica em 
Hubei, província da China (PHAM et al., 2020). Por ser uma doença desconhecida na 
época, os chineses reportaram à OMS casos de uma grave pneumonia em 31 de 
dezembro de 2019 (SÁ, 2020). Sem saber a origem das pneumonias, os profissionais 
de saúde acreditavam que elas poderiam estar relacionadas a uma doença zoonótica, 
pois os primeiros infectados trabalhavam ou estavam no mercado de frutos do mar 
3 
 
(SÁ, 2020). A suspeita foi baseada pelo fato da venda de animais vivos nesse mercado 
(SÁ, 2020). 
Foi somente no dia 7 de janeiro de 2020 que o novo coronavírus foi identificado 
como causador das pneumonias ocorridas e Wuhan. Esse vírus recebeu 
temporariamente o nome de 2019 novel coronavirus (2019-nCoV) (SÁ, 2020) que, em 
português, significa “novo coronavírus 2019”. Dois dias depois de identificado, o 
coronavírus faz sua primeira vítima em 09 de janeiro de 2020 (SÁ, 2020). A vítima era 
um homem de 61 anos que costumava a comprar alimentos no mercado de frutos do 
mar onde passaram a maioria das pessoas com a doença (CHINA..., 2020). 
Em 24 de janeiro de 2020, foram confirmados os primeiros casos do 
coronavírus na Europa. Foram confirmados dois casos na França (FRANÇA..., 2020). 
Seis dias depois, no dia 30 de janeiro de 2020, a Itália também confirma dois primeiros 
casos de infecção do novo coronavírus (ITÁLIA..., 2020). 
Em fevereiro de 2020, a OMS formalizou o nome da doença que passou a ser 
chamada de COVID-19. No mesmo período, o vírus recebeu o nome de SARS-CoV-
2 (SÁ, 2020). 
No dia 28 de março de 2020, a Itália ultrapassou 10 mil mortes ocasionadas 
pelo coronavírus, computando mais de 92 mil pessoas infectadas (NÚMERO..., 2020). 
Já era evidente que a Itália era o foco da pandemia na época, mas não demorou muito 
para que outro país tomasse o seu lugar. 
Enquanto a China e a Europa sofriam com a pandemia, assim como a Itália, os 
países americanos pareciam não acreditar na potencialidade de transmissão do vírus. 
A primeira cidade dos Estados Unidos a confirmar o novo coronavírus foi San Diego 
no dia 9 de fevereiro de 2020 (ESTADOS UNIDOS..., 2020), e em 13 de fevereiro foi 
constatado a transmissão assintomática do coronavírus pelo Centro de Controle e 
Prevenção de Doenças (CDC) dos Estados Unidos (SÁ, 2020). No dia 11 de abril de 
2020, os Estados Unidos já ultrapassavam a Itália em quantidade de mortos pela 
doença. A cidade mais afetada foi Nova York com mais de 8 mil mortes (ESTADOS..., 
2020). 
O Brasil registrou o primeiro caso de coronavírus em 26 de fevereiro de 2020 
(SÁ, 2020), e superou a Itália em número de infecções no dia 16 de maio 2020, onde 
foram registrados 233.142 casos de infecção da doença com 15.633 mortes (COVID-
19..., 2020). Segundo dados do Ministério da Saúde (2021), em 23 de fevereiro de 
4 
 
2021, o Brasil chegou a quase 10,2 milhões de casos confirmados e mais de 247 mil 
mortes. 
A partir de março de 2020, vários laboratórios começaram a estudar formas de 
fazer uma vacina para combater o coronavírus. O primeiro teste em humanos ocorreu 
nos Estados Unidos no dia 16 de março de 2020 em Seattle (EUA..., 2020). Dias após 
ao anúncio, outros centros de pesquisas e empresas privadas começaram a chamar 
voluntários para testes de imunizantes (PESQUISADORES..., 2020). Após o 
levantamento do tipo e os testes pré-clínicos, a vacina deve passar pelos ensaios 
clínicos que, conforme regulamento da Organização Mundial de Saúde (OMS), se 
dividem em quatro fases (PESQUISADORES..., 2020): 
a) Fase 1 – a vacina é aplicada em seres humanos, onde é verificada a 
segurança; 
b) Fase 2 – verifica a imunogenicidade, ou seja, como o organismo respondeu 
à vacina. 
c) Fase 3 – essa é a última fase dos estudos da vacina, onde é obtido o registro 
sanitário; 
d) Fase 4 – Aplicação da vacina na população. 
No dia 11 de agosto de 2020, o presidente Vladimir Putin anunciou o registro, 
na Rússia, da primeira vacina contra o coronavírus (RÚSSIA..., 2020). Embora a 
notícia parecesse boa na época, a decisão foi bastante questionada pela OMS, pois 
a vacina não teria ainda passado pela Fase 3 do estudo (RÚSSIA..., 2020). 
Na Europa, o Reino Unido foi o primeiro país a iniciar a vacinação da população 
no dia 08 de dezembro de 2020 (VEJA..., 2020). Em seguida, a União Europeia inicioua vacinação nos países pertencentes ao grupo no dia 27 de dezembro de 2020 
(PEDUZZI, 2020). Foram vacinados idosos e profissionais de saúde com a vacina 
produzida pela Pfizer e BioNTech (PEDUZZI, 2020). Após a iniciação da vacinação 
pelo Reino Unido, outros países como os Estados Unidos, Canadá, Emirados Árabes, 
Israel e Arábia Saudita tomaram a decisão de iniciar a vacinação em suas populações 
(VEJA..., 2020). 
No dia 14 de dezembro de 2020, o ministro da Saúde do Reino Unido anunciou 
a infecção de uma nova variante do SARS-CoV-2 em mais de mil indivíduos (REINO..., 
2020). Dias depois, em 18 de dezembro, o ministro da Saúde da África do Sul 
anunciou que médicos do país encontraram uma mutação do SARS-CoV-2 que 
5 
 
poderia estar relacionada, assim como a variante do Reino Unido, ao aumento do 
número de casos (NOVA..., 2020). 
No início de janeiro no Brasil, uma nova variante foi encontrada em Manaus. 
Muitos cientistas acreditam que essa variante foi responsável pelo colapso no sistema 
de saúde na capital amazonense (COVID..., 2021). A variante do Amazonas tem 
algumas mutações semelhantes às mutações encontradas no Reino Unido e África 
do Sul (COVID..., 2021). 
No dia 17 de janeiro de 2021, a Agência Nacional de Vigilância Sanitária 
(Anvisa) aprovou o uso emergencial da vacina CoronaVac e a da Oxford contra a 
COVID-19 (MÁXIMO, 2021). No mesmo dia, no Hospital das Clínicas em São Paulo, 
a enfermeira Mônica Calazans foi a primeira pessoa a ser vacina contra o coronavírus 
no Brasil (BADDINI; FERNANDES, 2021). Infelizmente, a quantidade de vacinas não 
era suficiente para frear o avanço do coronavírus no Brasil. Em 23 de fevereiro, o 
Brasil ocupou a terceira posição em quantidade de casos, conforme mostra a Tabela 
1 que lista os cinco países com maior número de casos nesse dia. 
 
Tabela 1 - Os cinco países com maior número de casos em 23/02/2021 (CORONAVÍRUS..., 2021). 
Local Total de casos Novos casos 
(1 dia) 
Casos por milhão 
de pessoas 
Mortes 
Estados Unidos 28.225.918 59.462 85.648 501.044 
Índia 11.016.434 10.584 8.097 156.463 
Brasil 10.195.160 26.986 48.241 247.143 
Rússia 4.130.447 12.455 28.147 82.255 
Reino Unido 4.126.150 10.641 62.108 120.757 
 
 
2. Ciências de Dados e Big Data 
 
 
Em várias áreas do conhecimento, a necessidade de processar grandes 
volumes de dados das mais variadas fontes existentes tornou-se essencial (BOYD; 
CRAWFORD, 2012, p. 663). Para isso, surgiu uma nova ciência para o estudo desses 
dados: a ciência de dados. O termo ciência de dados já tinha sido mencionado nos 
anos 1960, mas só atualmente se tornou mais conhecido devido à necessidade de 
obter conhecimento através dos dados (AMARAL, 2016). Os dados podem conter 
6 
 
informações ocultas que gerem insights, auxiliando nas tomadas de decisão de um 
negócio. Esses dados são armazenados em grandes volumes, em diversas fontes e 
em variadas formas (TATIANA; KOSHIYAMA, 2020). 
A ciência de dados pode ser definida como processos, modelos e tecnologias 
utilizadas para o estudo dos dados desde a produção até o descarte (AMARAL, 2016). 
A ciência de dados se consiste em várias etapas. Nos parágrafos seguintes serão 
abordadas as etapas de armazenamento, transformação e mineração dos dados. 
Antes da análise, os dados produzidos são armazenados em data marts que 
são bancos de dados específicos onde dados relevantes são armazenados para a 
extração do conhecimento (TATIANA; KOSHIYAMA, 2020). Os data marts podem 
estar agrupados em um armazém de dados comumente chamado de data warehouse 
(AMARAL, 2016). Geralmente, cada data mart está relacionado a um setor ou grupo 
de setores de um determinado negócio (AMARAL, 2016). A Figura 1 mostra um 
exemplo de uma estrutura de data warehouse dividido em data marts. 
 
Figura 1 - Estrutura de um data warehouse(AMARAL, 2016, p. 41). 
 
Depois do armazenamento, os dados dão transformados por ferramentas de 
Extração, Transformação e Carga (ETL - Extraction, Transformation and Loading) 
(TATIANA; KOSHIYAMA, 2020). As etapas seguintes já compreendem o 
7 
 
processamento e escolha de modelos que melhor se adequem aos problemas que se 
pretende conhecer. 
Para obter conhecimento através dos dados, foram criadas técnicas que 
possibilitam verificar padrões e a probabilidade desses padrões se repetirem de forma 
generalizada. Essas técnicas são chamadas de Mineração de Dados (Data Mining) 
(TATIANA; KOSHIYAMA, 2020). 
As fontes dos dados podem ser das mais variadas possíveis, por exemplo, 
sistemas de vendas, redes sociais, sistemas de monitoramento, sistemas de 
transporte, serviços de streaming etc. A tecnologia de armazenamento desses dados 
também é variada. Os dados podem estar armazenados em bancos de dados 
relacionais, planilhas, arquivos de texto etc. Por causa dessa mescla na forma de 
armazenamento dos dados, houve a necessidade de classificá-los em dados 
estruturados, semiestruturados e não estruturados (AMARAL, 2016). Os dados 
estruturados são os dados que estão armazenados em estruturas de linhas e colunas 
e com uma forte tipagem. Exemplo de dados estruturados são os Sistemas de 
Gerenciamento de Banco de Dados (SGBDs) e planilhas (AMARAL, 2016). Já os 
dados semiestruturados são dados cujo armazenamento é feito numa estrutura pré-
definida, mas que pode sofrer alguma alteração quando há inserções, remoções ou 
atualizações. São exemplos de dados semiestruturados os arquivos XML, JSON 
(AMARAL, 2016). Por último, os dados não estruturados são dados que não possuem 
armazenamento com uma estrutura definida. Esses dados são representados por 
arquivos de textos, documentos PDF, páginas da web, redes sociais etc. 
O conjunto de dados estruturados, semiestruturados e não estruturados 
utilizados para obter conhecimento é chamado de Big Data. Amaral (2016, p. 7) define 
Big Data como “fenômeno em que dados são produzidos em vários formatos e 
armazenados por uma grande quantidade de dispositivos e equipamentos”. Embora o 
termo dê somente uma ideia volume, Big Data tem mais de uma característica 
(MARQUESONE, 2016). Essas características são atualmente chamadas de 5 V’s: 
volume, velocidade, variedade, veracidade e valor. Muitos autores mencionam apenas 
3 V’s como características: volume, velocidade e variedade (MARQUESONE, 2016). 
Segundo Marquesone (2016) “O atributo volume é a característica mais 
significativa no conceito de Big Data.”. O volume em Big Data não indica apenas um 
valor fixo de bytes armazenados em um sistema, mas indica se o volume armazenado 
pode ser tratado por ferramentas tradicionais (MARQUESONE, 2016). Por exemplo, 
8 
 
um SGBD utilizado em um determinado setor tem capacidade de processar vários 
gigabytes de dados, mas caso essa quantidade chegue a alguns terabytes, o processo 
ficará lento. Nesse caso, é necessário a utilização de ferramentas que contenham 
mais poder de processamento que, em geral, utilizam processamento distribuído, 
aumentando a velocidade de processamento dos dados. A característica variedade 
foi atribuída pelo motivo de sistemas que implementam Big Data processar dados 
estruturados, semiestruturados e não estruturados (MARQUESONE, 2016). 
A velocidade é outra característica importante em Big Data. Com a necessidade 
de transformar e analisar um grande volume de dados variados, sistemas de Big Data 
contam com recursos de computação distribuída que utilizam ferramentas como o 
Hadoop e o Spark no tratamento, armazenamento e consulta dos dados. 
A veracidade é um atributo que caracteriza a confiabilidade dos dados 
escolhidos para o sistema de Big Data (MARQUESONE, 2016). Já o valor está 
relacionado à importância do dado no sistema de Big Data (MARQUESONE, 2016), 
ou seja, o dado tem que ser relevante para a análise, extração de conhecimento e 
tomada de decisão (TATIANA; KOSHIYAMA, 2020). 
 
 
3. Ciência de dados e Big Data na pandemia de COVID-19 
 
 
Ao buscartermos relacionados à ciência de dados e Big Data no combate à 
pandemia COVID-19 em sites de buscas acadêmicas como o a Scielo.org e o Google 
Acadêmico, foi possível encontrar algumas implementações e estudos realizados 
acerca do tema. Nos parágrafos abaixo serão abordados algumas implementações e 
estudos importantes para o combate da pandemia de COVID-19 utilizando a ciência 
de dados e Big Data. 
A Coreia do Sul implementou um sistema chamado COVID-19 Smart 
Management System (COVID-19 SMS) para monitorar o movimento das pessoas com 
COVID-19, extraindo dados de filmagens de câmeras de segurança, cartões de 
créditos e GPS (LIN; HOU, 2020). Ao identificar que uma pessoa pôde ter sido exposta 
ao vírus da COVID-19, os funcionários do Korea Center for Disease Control & 
Prevention (KCDC), “Centro Coreano para Controle e Prevenção de Doenças” em 
português, enviam uma mensagem a essa pessoa notificando a possível exposição 
9 
 
(LIN; HOU, 2020). Lançado em 26 de maro de 2020, o COVID-19 SMS teve como 
base a plataforma City Data Hub que foi desenvolvido para análise do tráfego, 
consumo de energia, meio ambiente e segurança em cidades inteligentes (LEE, D.; 
LEE, J., 2020). A Figura 2 ilustra o processo de análise do sistema COVID-19 SMS. 
 
Figura 2 – processo de análise do sistema COVID-19 SMS (LEE, S., 2020). 
O sistema COVID-19 SMS trouxe vantagens para o sistema de saúde da Coreia 
do Sul. Os principais benefícios foram (LEE, S., 2020): 
a) análise do movimento dos casos confirmados – manualmente os 
funcionários do sistema de saúde demoravam cerca de 24 horas para 
analisar os casos, mas com a implantação do sistema, a análise automática 
era concluída em cerca de 10 minutos; 
b) gerenciamento dos acessos às informações pessoais por meio de registros 
digitais – antes do sistema, todas as informações dos indivíduos eram 
escritas à mão; 
c) coordenação entre as organizações – as informações passaram a ser 
trocadas em tempo real. 
Na China, devido ao grande volume de pessoas, a necessidade de coletar 
dados de temperatura, de históricos de viagens em pontos de entradas e saídas das 
10 
 
cidades, de entradas nos tráfegos principais e nos aeroportos implicou na criação de 
um programa chamado QR Health Code (LIN; HOU, 2020). 
O QR Healh Code foi criado pela gigante do comércio eletrônico Alibaba em 
parceria com a cidade de Hangzhou, um dia após seu confinamento (CARNAP; 
DRINHAUSEN; SHI-KUPFER, 2020). Em pouco tempo, o aplicativo já tinha sido 
instalado em quase todos os 900 milhões de usuários de internet na China (CARNAP; 
DRINHAUSEN; SHI-KUPFER, 2020). 
Segundo Lin e Hou (2020), utilizando Inteligência Artificial (IA) e algoritmos de 
aprendizagem de máquina, o QR Health Code cruza os dados de autoavaliação da 
pessoa em relação ao seu estado de saúde, dos históricos de viagens utilizando Big 
Data da aviação, dos sistemas rodoviários e ferroviários, das redes sociais, da base 
de dados da COVID-19, de GPS e dos registros de pagamentos para rastrear os 
movimentos da pessoa infectada e de outras próximas a ela. 
 
 
O sistema armazena em códigos QR uma espécie de certificado de avaliação 
de saúde da pessoa (CARNAP; DRINHAUSEN; SHI-KUPFER, 2020). Ao escanear o 
código QR, três possíveis resultados para o risco individual podem ser encontrados: 
baixo, médio e alto (LIN; HOU, 2020). Um indicador no aplicativo móvel mostra o nível 
de risco da pessoa. O nível baixo é representado pela cor verde e indica que a pessoa 
Figura 3 – Diagrama do sistema QR Health Code da China (CARNAP; DRINHAUSEN; SHI-KUPFER, 
2020). 
11 
 
está livre para circular. O nível médio é representado pela cor amarela e a pessoa 
deve ficar de quarentena por 7 dias. Por último, a cor vermelha indica o nível alto, e, 
nesse caso, a pessoa deve ficar de quarentena por 14 dias (LIN; HOU, 2020). A Figura 
3 ilustra um diagrama do sistema QR Health Code. Em vários estabelecimentos, 
transportes públicos e conjuntos habitacionais, a apresentação do código QR tornou-
se obrigatória. 
Em março de 2020, Zohu et al. (2020) propuseram um sistema que integra o 
Sistema de Informação Geográfica (SIG) a sistemas de Big Data de diversas fontes 
no intuito de mapear a evolução da pandemia de COVID-19 na China. 
No estudo de Zohu et al. (2020) foram analisadas a representação espacial da 
doença, população e psicologia social em três escalas: individual, por grupo e por 
região. Na escala individual, os movimentos dos indivíduos no espaço e no tempo 
foram mapeados e comparados com o movimento no espaço da pandemia. Na escala 
por grupo, foram estimados o fluxo populacional e a distribuição da população no 
espaço. Na escala regional, o estudo segmentou o risco espacial, analisou o balanço 
entre a disponibilidade de recursos médicos e a demanda por eles. 
Para que o sistema pudesse ser integrado, foram necessárias as seguintes 
etapas (ZOHU et al., 2020): 
a) conectar os departamentos de saúde na internet; 
b) construir uma base de dados multidimensional utilizando o modelo de cubo 
espaço-temporal para Big Data da pandemia; 
c) criar uma ferramenta para a análise dos dados para tomada de decisão; 
d) desenvolver o SIG online para visualização espaço-temporal, navegando 
geograficamente através das operações slice and dice (fatiar e cortar) sobre 
o país, província, cidade, condado, comunidade e indivíduo (ZOHU et al., 
2020). 
Também em março de 2020, nos Estados Unidos, Magar, Yadav e Farimani 
(2020) utilizaram aprendizagem de máquina para buscar potenciais anticorpos que 
pudessem neutralizar a ação do coronavírus. A expansão de dados biológicos, em 
especial os de DNA, tornou possível a predição de fenômenos biológicos por meio da 
aprendizagem de máquina. Segundo os autores, a máquina poderia prever anticorpos 
com maior potencial de neutralização de um determinado vírus. Foram utilizados 
dados de sequenciamento genético de vários vírus como o HIV, dengue e SARS. Com 
esses dados, foram executados treinamentos para que pudesse ser selecionado o 
12 
 
melhor modelo de aprendizado de máquina. Após o processo de aprendizagem, foi 
possível identificar oito tipos de anticorpos que poderiam neutralizar a COVID-19. 
No Brasil, a Fundação Oswaldo Cruz (Fiocruz) criou um sistema de Big Data 
chamado MonitoraCovid-19. Este sistema coleta dados de diversas fontes (FIOCRUZ, 
2021) e os consolidam possibilitando que as pessoas visualizem em painéis a 
evolução e a movimentação da doença pelo país. Segundo a Fiocruz (2021) as 
informações coletadas pelo sistema “possibilitam desenvolver modelos preditivos 
adequados à realidade nacional, capazes de informar ações de contenção e 
tratamento”. 
As principais fontes de dados para o sistema são (FIOCRUZ, 2021): 
a) Johns Hopkins University Center for Systems Science and Engineering (JHU 
CCSE) – contém arquivos no formato comma-separated values (CSV), 
valores separados por vírgulas em português, com informações sobre a 
pandemia pelo mundo; 
b) Ministério da Saúde – são obtidos os dados dos estados e munícipios pelo 
sistema Covid MS; 
c) Universidade de Maryland – em parceria com o Facebook, professores da 
universidade coletam resultados de pesquisas feitas por formulários nos 
aplicativos do Facebook que perguntam se há casos de pessoas com 
sintomas semelhantes à da COVID-19 em suas casas, e, com estes dados, 
é estimada a porcentagem de pessoas em uma região com sintomas 
semelhantes aos da COVID-19 e os da influenza (BARKAY et al., 2020); 
d) Waze através do IDB Coronavirus Impact Dashboard - o IDB Coronavirus 
Impact Dashboard é um painel criado pela Inter-American Development 
Bank (IDB) que tem por objetivo acompanhar os impactos do coronavírus 
nos países da América Latina e do Caribe obtendo dados do transporte 
público, congestionamento e casos de COVID-19 desses países (IDB, 2021); 
e) Projeto Google COVID-19 Community Mobility Report – disponibilizarelatórios que fornecem dados em arquivos CSV e Portable Document 
Format (PDF) das mudanças ocorridas (no varejo, lazer, mercados, 
transporte público, etc.) em diversas regiões do mundo em meio às políticas 
de combate à pandemia (GOOGLE, 2021); 
f) Moovit Public Transit Index – fornece estatísticas do transporte público pelo 
mundo (FIOCRUZ, 2021). 
13 
 
Conclusões 
 
 
Este artigo teve como objetivo descrever implementações e/ou estudos 
realizados no combate à pandemia de COVID-19 utilizando a ciência de dados e Big 
Data como ferramentas para análises e tomadas de decisões. 
Embora as tecnologias utilizadas na ciência de dados e em Big Data tenham 
avançado nos últimos anos, elas não foram capazes de prever a pandemia de COVID-
19. Embora não tenha conseguido prever a doença, os estudos e implementações 
utilizando essas tecnologias durante a pandemia foram muito importantes. 
Na primeira sessão, este artigo apresentou uma breve história da pandemia de 
COVID-19, desde o seu surgimento até a aparição das novas mutações do vírus. Na 
segunda sessão foi apresentado, de forma sintetizada, o conceito de ciência de dados 
e Big Data. Já na terceira sessão, o artigo descreveu algumas implementações e 
pesquisas feitas utilizando ciência de dados e Big Data. 
Na pesquisa, foi possível verificar que a aplicação da ciência de dados e Big 
Data no combate à pandemia se mostrou importante. Foram encontrados sistemas 
que utilizam reconhecimento facial, dados de GPS, dados de pagamentos e outros 
para rastrear os movimentos dos indivíduos. Este artigo abrange o sistema chinês QR 
Health Code que utiliza código QR para indicar o risco de exposição de um indivíduo 
à COVID-19. Também foi encontrado um estudo que utilizou a ciência de dados e Big 
Data das bases de dados de DNA pelo mundo para gerar modelos computacionais 
que pudessem selecionar anticorpos capazes de neutralizarem o SARS-CoV-2. 
Este artigo conclui que a ciência de dados e Big Data são ferramentas 
essenciais nas tomadas de decisões e pesquisas envolvendo grandes volumes de 
dados, fatores que estão presentes em uma pandemia como a da COVID-19. Sem 
essas tecnologias, os processos de combate à pandemia seriam mais lentos, já que 
demandam muitas informações em diversas fontes, e o trabalho manual seria 
dispendioso e ineficiente. 
 
14 
 
Referências 
 
 
AMARAL, F. Introdução à ciência de dados: mineração de dados e Big Data. Rio 
de Janeiro: Alta Books, 2016. 
 
BADDINI, Bruna; FERNANDES, Daniel. Primeira pessoa é vacinada contra Covid-
19 no Brasil. CNN Brasil, São Paulo, 17 jan. 2021. Disponível em: 
https://www.cnnbrasil.com.br/nacional/2021/01/17/primeira-pessoa-e-vacinada-
contra-covid-19-no-brasil. Acesso em: 13 mar. 2021. 
 
BARKAY, Neta; COBB, Curtiss; EILAT, Roee; GALILI, Tal; HAIMOVICH, Daniel; 
LAROCCA, Sarah; MORRIS, Katherine; SARIG, Tal. Weights and Methodology 
Brief for the COVID-19 Symptom Survey by University of Maryland and 
Carnegie Mellon University, in Partnership with Facebook. Facebook Research, 
out. 2020. 
 
BOYD, danah; CRAWFORD, Kate. CRITICAL QUESTIONS FOR BIG DATA: 
Provocations for a cultural, technological, and scholarly phenomenon. Londres, 
Information, Communication & Society, 10 mai. 2012. 
 
CARNAP, Kai von; DRINHAUSEN, Katja; SHI-KUPFER, Kristin. TRACING. Testing. 
Tweaking: Approaches to data-driven Covid-19 management in China. MERICS 
- Mercator Institute for China Studies, 24 jun. 2020, Disponível em: 
https://merics.org/en/report/tracing-testing-tweaking. Acesso em: 14 fev. 2021. 
 
CHINA tem 1ª morte por misteriosa pneumonia viral. G1. [S.I.], 11 jan. 2020. 
Disponível em: https://g1.globo.com/mundo/noticia/2020/01/11/china-tem-1a-morte-
por-misteriosa-pneumonia-viral.ghtml. Acesso em: 05 fev. 2021. 
 
CORONAVÍRUS (COVID-19). Google Notícias. [S.I.], 23 fev. 2021. Disponível em: 
https://news.google.com/covid19/map. Acesso em: 23 fev. 2021. 
 
COVID-19: Brasil passa Itália e Espanha em casos e supera 15 mil mortes. UOL. 
[S.I.], 16 mai. 2020. Disponível em: https://noticias.uol.com.br/saude/ultimas-
noticias/redacao/2020/05/16/casos-e-obitos-coronavirus-brasil-16-de-maio.htm. 
Acesso em: 23 fev. 2021. 
 
COVID em Manaus: nova variante pode estar por trás de caos no Amazonas, dizem 
pesquisadores. BBC Brasil. [S.I.], 15 jan. 2021. Disponível em: 
https://www.bbc.com/portuguese/brasil-55677738. Acesso em: 16 mar. 2021. 
 
ESCOVEDO, Tatiana; KOSHIYAMA, Adriano. Introdução a Data Science: 
Algoritmos de Machine Learning e métodos de análise. São Paulo: Casa do 
Código, 2020. 288 p. ISBN 8572540555, 9788572540551. 
 
https://www.cnnbrasil.com.br/nacional/2021/01/17/primeira-pessoa-e-vacinada-contra-covid-19-no-brasil
https://www.cnnbrasil.com.br/nacional/2021/01/17/primeira-pessoa-e-vacinada-contra-covid-19-no-brasil
https://news.google.com/covid19/map
https://noticias.uol.com.br/saude/ultimas-noticias/redacao/2020/05/16/casos-e-obitos-coronavirus-brasil-16-de-maio.htm
https://noticias.uol.com.br/saude/ultimas-noticias/redacao/2020/05/16/casos-e-obitos-coronavirus-brasil-16-de-maio.htm
https://www.bbc.com/portuguese/brasil-55677738
15 
 
ESTADOS UNIDOS confirmam primeiro caso de coronavírus próximo à fronteira 
com o México. O Estado de S. Paulo. São Paulo, [S.I.], 11 fev. 2020. Disponível em: 
https://saude.estadao.com.br/noticias/geral,estados-unidos-confirmam-primeiro-
caso-de-coronavirus-proximo-a-fronteira-com-o-mexico,70003193208. Acesso em: 
22 fev. 2021. 
 
ESTADOS Unidos superam Itália como o país com mais mortos por coronavírus. O 
Globo. [S.I.], 11 abr. 2020. Disponível em: https://oglobo.globo.com/mundo/estados-
unidos-superam-italia-como-pais-com-mais-mortos-por-coronavirus-24365827. 
Acesso em: 05 fev. 2021. 
 
EUA realizam primeiro teste de vacina contra o coronavírus em humanos. G1. [S.I.], 
17 mar. 2020. Disponível em: 
https://g1.globo.com/bemestar/coronavirus/noticia/2020/03/17/eua-realiza-primeiro-
teste-de-vacina-contra-o-coronavirus-em-humanos.ghtml. Acesso em: 25 fev. 2021. 
 
FIOCRUZ. Instituto de Comunicação e Informação Científica e Tecnológica em 
Saúde (ICICT). MonitoraCovid-19. Rio de Janeiro, 2020. Disponível em: 
https://bigdata-covid19.icict.fiocruz.br/. Acesso em 13 fev. 2021. 
 
FRANÇA é o primeiro país da Europa a registrar caso do novo coronavírus. Jornal 
Nacional. [S.I.], 24 jan. 2020. Disponível em: https://g1.globo.com/jornal-
nacional/noticia/2020/01/24/franca-e-o-primeiro-pais-da-europa-a-registrar-caso-do-
novo-coronavirus.ghtml. Acesso em: 22 fev. 2021. 
 
GALLEGO, Inmaculada; FONT, Xavier. Changes in air passenger demand as a 
result of the COVID-19 crisis: using Big Data to inform tourism policy. Journal of 
Sustainable Tourism, mai. 2020. ISSN: 0966-9582. 
 
GOOGLE. COVID-19: Relatórios de mobilidade da comunidade. Disponível em: 
https://www.google.com/covid19/mobility/. Acesso em: 11 mar. 2021. 
 
IDB. CORONAVIRUS IMPACT DASHBOARD. Disponível em: 
https://www.iadb.org/en/topics-effectiveness-improving-lives/coronavirus-impact-
dashboard. Acesso em: 11 mar. 2021. 
 
ITÁLIA confirma primeiros casos de coronavírus no país. G1. [S.I.], 30 jan. 2020. 
Disponível em: https://g1.globo.com/ciencia-e-saude/noticia/2020/01/30/italia-
confirma-primeiros-casos-de-coronavirus-no-pais.ghtml. Acesso em: 22 fev. 2021. 
 
LEE, David; LEE, Jaehong. Testing on the move: South Korea's rapid response 
to the COVID-19 pandemic. Daejeon, ELSEVIER, v. 5, mai. 2020. 
 
LEE, Sanghoon. COVID-19 Smart Management System (SMS) in Korea. Korea 
Agency of Infrastructure Technology Advancement, 2020. Slides. Disponível em: 
COVID-19: Smart Management System (SMS) in the Republic of Korea | ADB 
Knowledge Event Repository (development.asia). Acesso em: 16 mar. 2021. 
 
LIN, Leesa; HOU, Zhiyuan. Combat COVID-19 with artificial intelligence and Big 
Data. Londres, Journal of Travel Medicine, vol. 27, mai. 2020. 
https://saude.estadao.com.br/noticias/geral,estados-unidos-confirmam-primeiro-caso-de-coronavirus-proximo-a-fronteira-com-o-mexico,70003193208https://saude.estadao.com.br/noticias/geral,estados-unidos-confirmam-primeiro-caso-de-coronavirus-proximo-a-fronteira-com-o-mexico,70003193208
https://g1.globo.com/bemestar/coronavirus/noticia/2020/03/17/eua-realiza-primeiro-teste-de-vacina-contra-o-coronavirus-em-humanos.ghtml
https://g1.globo.com/bemestar/coronavirus/noticia/2020/03/17/eua-realiza-primeiro-teste-de-vacina-contra-o-coronavirus-em-humanos.ghtml
https://g1.globo.com/jornal-nacional/noticia/2020/01/24/franca-e-o-primeiro-pais-da-europa-a-registrar-caso-do-novo-coronavirus.ghtml
https://g1.globo.com/jornal-nacional/noticia/2020/01/24/franca-e-o-primeiro-pais-da-europa-a-registrar-caso-do-novo-coronavirus.ghtml
https://g1.globo.com/jornal-nacional/noticia/2020/01/24/franca-e-o-primeiro-pais-da-europa-a-registrar-caso-do-novo-coronavirus.ghtml
https://www.google.com/covid19/mobility/
https://www.iadb.org/en/topics-effectiveness-improving-lives/coronavirus-impact-dashboard
https://www.iadb.org/en/topics-effectiveness-improving-lives/coronavirus-impact-dashboard
https://g1.globo.com/ciencia-e-saude/noticia/2020/01/30/italia-confirma-primeiros-casos-de-coronavirus-no-pais.ghtml
https://g1.globo.com/ciencia-e-saude/noticia/2020/01/30/italia-confirma-primeiros-casos-de-coronavirus-no-pais.ghtml
https://events.development.asia/materials/20200422/covid-19-smart-management-system-sms-republic-korea
https://events.development.asia/materials/20200422/covid-19-smart-management-system-sms-republic-korea
16 
 
 
MAGAR, Rishikesh; YADAV, Prakars; FARIMANI, Amir Barati. Potential 
Neutralizing Antibodies Discovered for Novel Corona Virus Using Machine 
Learning. Disponível em: https://arxiv.org/ftp/arxiv/papers/2003/2003.08447.pdf. 
Acesso em: 08 fev. 2021. 18 mar. 2020. 
 
MARQUESONE, Rosangela. Big Data: Técnicas e tecnologias para extração de 
valor dos dados. São Paulo: Editora Casa do Código, 2016. 220 p. ISBN 
8555192323, 9788555192326. 
 
MÁXIMO, Wellton. Por unanimidade, Anvisa aprova uso emergencial de vacinas 
contra covid. Agência Brasil, Brasília, 17 jan. 2021. Disponível em: 
https://agenciabrasil.ebc.com.br/saude/noticia/2021-01/por-unanimidade-anvisa-
aprova-uso-emergencial-de-vacinas-contra-covid. Acesso em: 13 mar. 2021. 
 
MINISTÉRIO DA SAÚDE (Brasil). Painel Coronavírus. Brasília, 2021. Disponível 
em: https://covid.saude.gov.br/. Acesso em: 23 fev. 2021. 
 
NOVA variante do coronavírus é detectada na África do Sul. G1. [S.I.], 18 dez. 2020. 
Disponível em: https://g1.globo.com/bemestar/coronavirus/noticia/2020/12/18/nova-
variante-do-coronavirus-e-detectada-na-africa-do-sul.ghtml. Acesso em: 16 mar. 
2021. 
 
NÚMERO de mortos na Itália ultrapassa 10 mil; infectados já são mais de 92 mil. O 
Globo. [S.I], 28 mar. 2020. Disponível em: https://oglobo.globo.com/mundo/numero-
de-mortos-na-italia-ultrapassa-10-mil-infectados-ja-sao-mais-de-92-mil-24335690. 
Acesso em: 14 mar. 2021. 
 
PEDUZZI, Pedro. Países da Europa começam a aplicar vacina da Pfizer contra 
covid-19. Agência Brasil, Brasília, 27 dez. 2020. Disponível em: 
https://agenciabrasil.ebc.com.br/internacional/noticia/2020-12/paises-da-europa-
comecam-aplicar-vacina-da-pfizer-contra-covid-19. Acesso em: 13 mar. 2021. 
 
PESQUISADORES e empresas anunciam testes experimentais de vacinas contra a 
Covid-19. G1. [S.I.], 30 mar. 2020. Disponível em: 
https://g1.globo.com/bemestar/coronavirus/noticia/2020/03/30/pesquisadores-e-
empresas-anunciam-testes-experimentais-de-vacinas-contra-a-covid-19.ghtml. 
Acesso em: 25 fev. 2021. 
 
PHAM, Quoc-Viet; NGUYEN, Dinh C.; HUYNH-THE, Thien; HWANG, Won-Joo; 
PATHIRANA, Pubudu N. Artificial Intelligence (AI) and Big Data for Coronavirus 
(COVID-19) Pandemic: A Survey on the State-of-the-Arts. Preprints, abr. 2020. 
 
REINO Unido diz ter localizado variante do coronavírus que pode estar associada a 
aumento de casos. G1. [S.I], 14 dez. 2020. Disponível em: 
https://g1.globo.com/bemestar/coronavirus/noticia/2020/12/14/reino-unido-diz-ter-
localizado-variante-do-coronavirus-que-pode-estar-associada-a-aumento-de-
casos.ghtml. Acesso em 16 mar. 2021. 
 
https://arxiv.org/ftp/arxiv/papers/2003/2003.08447.pdf
https://agenciabrasil.ebc.com.br/saude/noticia/2021-01/por-unanimidade-anvisa-aprova-uso-emergencial-de-vacinas-contra-covid
https://agenciabrasil.ebc.com.br/saude/noticia/2021-01/por-unanimidade-anvisa-aprova-uso-emergencial-de-vacinas-contra-covid
https://covid.saude.gov.br/
https://g1.globo.com/bemestar/coronavirus/noticia/2020/12/18/nova-variante-do-coronavirus-e-detectada-na-africa-do-sul.ghtml
https://g1.globo.com/bemestar/coronavirus/noticia/2020/12/18/nova-variante-do-coronavirus-e-detectada-na-africa-do-sul.ghtml
https://oglobo.globo.com/mundo/numero-de-mortos-na-italia-ultrapassa-10-mil-infectados-ja-sao-mais-de-92-mil-24335690
https://oglobo.globo.com/mundo/numero-de-mortos-na-italia-ultrapassa-10-mil-infectados-ja-sao-mais-de-92-mil-24335690
https://agenciabrasil.ebc.com.br/internacional/noticia/2020-12/paises-da-europa-comecam-aplicar-vacina-da-pfizer-contra-covid-19
https://agenciabrasil.ebc.com.br/internacional/noticia/2020-12/paises-da-europa-comecam-aplicar-vacina-da-pfizer-contra-covid-19
https://g1.globo.com/bemestar/coronavirus/noticia/2020/03/30/pesquisadores-e-empresas-anunciam-testes-experimentais-de-vacinas-contra-a-covid-19.ghtml
https://g1.globo.com/bemestar/coronavirus/noticia/2020/03/30/pesquisadores-e-empresas-anunciam-testes-experimentais-de-vacinas-contra-a-covid-19.ghtml
https://g1.globo.com/bemestar/coronavirus/noticia/2020/12/14/reino-unido-diz-ter-localizado-variante-do-coronavirus-que-pode-estar-associada-a-aumento-de-casos.ghtml
https://g1.globo.com/bemestar/coronavirus/noticia/2020/12/14/reino-unido-diz-ter-localizado-variante-do-coronavirus-que-pode-estar-associada-a-aumento-de-casos.ghtml
https://g1.globo.com/bemestar/coronavirus/noticia/2020/12/14/reino-unido-diz-ter-localizado-variante-do-coronavirus-que-pode-estar-associada-a-aumento-de-casos.ghtml
17 
 
RÚSSIA anuncia primeira vacina contra a covid-19. Agência Brasil. [S.I.], 11 ago. 
2020. Disponível em: https://agenciabrasil.ebc.com.br/internacional/noticia/2020-
08/russia-anuncia-primeira-vacina-contra-covid-19. Acesso em: 25 fev. 2021. 
 
SÁ, D. M. Especial Covid-19: Os historiadores e a pandemia. FIOCRUZ, 18 set. 
2020; Disponível em: http://www.coc.fiocruz.br/index.php/pt/todas-as-noticias/1853-
especial-covid-19-os-historiadores-e-a-pandemia.html#.YB3UR3lv-Uk. Acesso em: 
05 fev. de 2021. 
 
VEJA quais países iniciaram a vacinação contra a Covid-19; Brasil está fora. CNN 
Brasil. [S.I.], 24 dez. 2020. Disponível em: 
https://www.cnnbrasil.com.br/saude/2020/12/24/quais-os-paises-que-ja-comecaram-
a-vacinacao-contra-a-covid-19. Acesso em: 13 mar. 2021. 
 
ZOHU, Chenghu; SU, Fenzhen; PEI, Tao; ZHANG, An; DU, Yunyan; LUO, Bin; CAO, 
Zhidong; WANG, Juanle; YUAN, Wen; ZHU, Yunqiang; SONG, Ci; CHEN, Jien; XU, 
Jun; LI, Fujia; MA, Ting; JIANG, Lili; YAN, Fengqin; YI, Jiawei; HU, Yunfeng; LIAO, 
Yilan; XIAO, Han. COVID-19: Challenges to GIS with Big Data. Geography and 
Sustainability, Beijing, v. 1, p. 77-88, mar. 2020. ISSN 2666-6839. 
http://www.coc.fiocruz.br/index.php/pt/todas-as-noticias/1853-especial-covid-19-os-historiadores-e-a-pandemia.html#.YB3UR3lv-Uk
http://www.coc.fiocruz.br/index.php/pt/todas-as-noticias/1853-especial-covid-19-os-historiadores-e-a-pandemia.html#.YB3UR3lv-Uk
https://www.cnnbrasil.com.br/saude/2020/12/24/quais-os-paises-que-ja-comecaram-a-vacinacao-contra-a-covid-19
https://www.cnnbrasil.com.br/saude/2020/12/24/quais-os-paises-que-ja-comecaram-a-vacinacao-contra-a-covid-19

Continue navegando