Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Ciência de dados e Big Data: implementações e estudos na pandemia de COVID-19 João Paulo Ferreira da Silva* Resumo Este artigo tem como objetivo verificar a contribuição da ciência de dados e Big Data na pandemia de COVID-19. Utilizando pesquisa bibliográfica, este artigo aborda a decisão de países como a China e a Coréia do Sul de criar sistemas baseados em ciência de dados e Big Data para monitorar a movimentação do coronavírus causador da pandemia de COVID-19 e tomar decisões baseadas nas análises dos dados. Também aborda as publicações de pesquisas que utilizaram a ciência de dados e Big Data durante a pandemia. Este artigo conclui que mesmo não sendo possível a previsão de pandemias no momento, como a da COVID-19, a ciência de dados e Big Data têm sido fortes aliados no combate à doença através de ferramentas de análise de dados e aprendizagem de máquina, possibilitando tomadas de decisões e até simular anticorpos capazes de neutralizar o vírus da COVID-19. Palavras-chave: Ciência de Dados. Big Data. Pandemia. COVID-19. Introdução Em 2020, o mundo foi acometido de uma doença com uma alta velocidade de transmissão. No fim do ano 2019 e início do ano 2020, essa doença tornou-se um mistério para diversos cientistas chineses que tentavam descobrir a sua origem (SÁ, 2020). Semanas depois, foi descoberto que a doença era causada pela mutação de um coronavírus batizado de Severe Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-2) que em português significa “Coronavírus da Síndrome Respiratória Aguda Grave 2” (SÁ, 2020). Por causa da alta velocidade de transmissão do SARS-CoV-2, os governos viram a necessidade de acompanhar o movimento do vírus em seus países. Para analisar uma quantidade enorme de dados das mais variadas fontes e tipos, os governos utilizaram tecnologias de Big Data e ciência de dados no monitoramento da pandemia e nas tomadas de decisões. * Pós-graduando em Ciência de Dados e Big Data Analytics na Universidade Estácio de Sá. 2 Neste contexto, este artigo pretende responder a seguinte questão norteadora: de que forma a ciência de dados e Big Data estão ajudando no combate à pandemia de COVID-19 no mundo? O objetivo que este artigo é apresentar e descrever implementações de sistemas e estudos baseados em ciências de dados e Big Data durante a pandemia de COVID-19. Este artigo é relevante para que se tome conhecimento da contribuição que as tecnologias baseadas na ciência de dados e Big Data estão dando no combate à pandemia de COVID-19. Com este conhecimento, as organizações podem tomar como base as implementações apresentadas neste artigo para desenvolver sistemas também baseados em ciência de dados e Big Data que auxiliem no combate à pandemia de COVID-19 ou até mesmo à outras doenças que atinjam grandes populações. Utilizando pesquisa bibliográfica, este artigo buscou, através de mecanismos de buscas acadêmicas como o Scielo.org e o Google Scholar, publicações relacionadas ao tema. Também foram utilizadas fontes jornalísticas, pois a pandemia de COVID-19 é um fato novo na sociedade e, por conta disso, não existem muitos trabalhos relacionados. Este artigo se inicia com um breve histórico da evolução da pandemia de COVID-19, e, logo depois, uma introdução do conceito de ciência de da dados e Big Data. Após essas abordagens, serão apresentados quatro sistemas e uma pesquisa que utilizam ciência de dados e Big Data no combate à pandemia de COVID-19. 1. Breve história da pandemia de COVID-19 O primeiro caso registrado de COVID-19 foi na cidade de Wuhan que fica em Hubei, província da China (PHAM et al., 2020). Por ser uma doença desconhecida na época, os chineses reportaram à OMS casos de uma grave pneumonia em 31 de dezembro de 2019 (SÁ, 2020). Sem saber a origem das pneumonias, os profissionais de saúde acreditavam que elas poderiam estar relacionadas a uma doença zoonótica, pois os primeiros infectados trabalhavam ou estavam no mercado de frutos do mar 3 (SÁ, 2020). A suspeita foi baseada pelo fato da venda de animais vivos nesse mercado (SÁ, 2020). Foi somente no dia 7 de janeiro de 2020 que o novo coronavírus foi identificado como causador das pneumonias ocorridas e Wuhan. Esse vírus recebeu temporariamente o nome de 2019 novel coronavirus (2019-nCoV) (SÁ, 2020) que, em português, significa “novo coronavírus 2019”. Dois dias depois de identificado, o coronavírus faz sua primeira vítima em 09 de janeiro de 2020 (SÁ, 2020). A vítima era um homem de 61 anos que costumava a comprar alimentos no mercado de frutos do mar onde passaram a maioria das pessoas com a doença (CHINA..., 2020). Em 24 de janeiro de 2020, foram confirmados os primeiros casos do coronavírus na Europa. Foram confirmados dois casos na França (FRANÇA..., 2020). Seis dias depois, no dia 30 de janeiro de 2020, a Itália também confirma dois primeiros casos de infecção do novo coronavírus (ITÁLIA..., 2020). Em fevereiro de 2020, a OMS formalizou o nome da doença que passou a ser chamada de COVID-19. No mesmo período, o vírus recebeu o nome de SARS-CoV- 2 (SÁ, 2020). No dia 28 de março de 2020, a Itália ultrapassou 10 mil mortes ocasionadas pelo coronavírus, computando mais de 92 mil pessoas infectadas (NÚMERO..., 2020). Já era evidente que a Itália era o foco da pandemia na época, mas não demorou muito para que outro país tomasse o seu lugar. Enquanto a China e a Europa sofriam com a pandemia, assim como a Itália, os países americanos pareciam não acreditar na potencialidade de transmissão do vírus. A primeira cidade dos Estados Unidos a confirmar o novo coronavírus foi San Diego no dia 9 de fevereiro de 2020 (ESTADOS UNIDOS..., 2020), e em 13 de fevereiro foi constatado a transmissão assintomática do coronavírus pelo Centro de Controle e Prevenção de Doenças (CDC) dos Estados Unidos (SÁ, 2020). No dia 11 de abril de 2020, os Estados Unidos já ultrapassavam a Itália em quantidade de mortos pela doença. A cidade mais afetada foi Nova York com mais de 8 mil mortes (ESTADOS..., 2020). O Brasil registrou o primeiro caso de coronavírus em 26 de fevereiro de 2020 (SÁ, 2020), e superou a Itália em número de infecções no dia 16 de maio 2020, onde foram registrados 233.142 casos de infecção da doença com 15.633 mortes (COVID- 19..., 2020). Segundo dados do Ministério da Saúde (2021), em 23 de fevereiro de 4 2021, o Brasil chegou a quase 10,2 milhões de casos confirmados e mais de 247 mil mortes. A partir de março de 2020, vários laboratórios começaram a estudar formas de fazer uma vacina para combater o coronavírus. O primeiro teste em humanos ocorreu nos Estados Unidos no dia 16 de março de 2020 em Seattle (EUA..., 2020). Dias após ao anúncio, outros centros de pesquisas e empresas privadas começaram a chamar voluntários para testes de imunizantes (PESQUISADORES..., 2020). Após o levantamento do tipo e os testes pré-clínicos, a vacina deve passar pelos ensaios clínicos que, conforme regulamento da Organização Mundial de Saúde (OMS), se dividem em quatro fases (PESQUISADORES..., 2020): a) Fase 1 – a vacina é aplicada em seres humanos, onde é verificada a segurança; b) Fase 2 – verifica a imunogenicidade, ou seja, como o organismo respondeu à vacina. c) Fase 3 – essa é a última fase dos estudos da vacina, onde é obtido o registro sanitário; d) Fase 4 – Aplicação da vacina na população. No dia 11 de agosto de 2020, o presidente Vladimir Putin anunciou o registro, na Rússia, da primeira vacina contra o coronavírus (RÚSSIA..., 2020). Embora a notícia parecesse boa na época, a decisão foi bastante questionada pela OMS, pois a vacina não teria ainda passado pela Fase 3 do estudo (RÚSSIA..., 2020). Na Europa, o Reino Unido foi o primeiro país a iniciar a vacinação da população no dia 08 de dezembro de 2020 (VEJA..., 2020). Em seguida, a União Europeia inicioua vacinação nos países pertencentes ao grupo no dia 27 de dezembro de 2020 (PEDUZZI, 2020). Foram vacinados idosos e profissionais de saúde com a vacina produzida pela Pfizer e BioNTech (PEDUZZI, 2020). Após a iniciação da vacinação pelo Reino Unido, outros países como os Estados Unidos, Canadá, Emirados Árabes, Israel e Arábia Saudita tomaram a decisão de iniciar a vacinação em suas populações (VEJA..., 2020). No dia 14 de dezembro de 2020, o ministro da Saúde do Reino Unido anunciou a infecção de uma nova variante do SARS-CoV-2 em mais de mil indivíduos (REINO..., 2020). Dias depois, em 18 de dezembro, o ministro da Saúde da África do Sul anunciou que médicos do país encontraram uma mutação do SARS-CoV-2 que 5 poderia estar relacionada, assim como a variante do Reino Unido, ao aumento do número de casos (NOVA..., 2020). No início de janeiro no Brasil, uma nova variante foi encontrada em Manaus. Muitos cientistas acreditam que essa variante foi responsável pelo colapso no sistema de saúde na capital amazonense (COVID..., 2021). A variante do Amazonas tem algumas mutações semelhantes às mutações encontradas no Reino Unido e África do Sul (COVID..., 2021). No dia 17 de janeiro de 2021, a Agência Nacional de Vigilância Sanitária (Anvisa) aprovou o uso emergencial da vacina CoronaVac e a da Oxford contra a COVID-19 (MÁXIMO, 2021). No mesmo dia, no Hospital das Clínicas em São Paulo, a enfermeira Mônica Calazans foi a primeira pessoa a ser vacina contra o coronavírus no Brasil (BADDINI; FERNANDES, 2021). Infelizmente, a quantidade de vacinas não era suficiente para frear o avanço do coronavírus no Brasil. Em 23 de fevereiro, o Brasil ocupou a terceira posição em quantidade de casos, conforme mostra a Tabela 1 que lista os cinco países com maior número de casos nesse dia. Tabela 1 - Os cinco países com maior número de casos em 23/02/2021 (CORONAVÍRUS..., 2021). Local Total de casos Novos casos (1 dia) Casos por milhão de pessoas Mortes Estados Unidos 28.225.918 59.462 85.648 501.044 Índia 11.016.434 10.584 8.097 156.463 Brasil 10.195.160 26.986 48.241 247.143 Rússia 4.130.447 12.455 28.147 82.255 Reino Unido 4.126.150 10.641 62.108 120.757 2. Ciências de Dados e Big Data Em várias áreas do conhecimento, a necessidade de processar grandes volumes de dados das mais variadas fontes existentes tornou-se essencial (BOYD; CRAWFORD, 2012, p. 663). Para isso, surgiu uma nova ciência para o estudo desses dados: a ciência de dados. O termo ciência de dados já tinha sido mencionado nos anos 1960, mas só atualmente se tornou mais conhecido devido à necessidade de obter conhecimento através dos dados (AMARAL, 2016). Os dados podem conter 6 informações ocultas que gerem insights, auxiliando nas tomadas de decisão de um negócio. Esses dados são armazenados em grandes volumes, em diversas fontes e em variadas formas (TATIANA; KOSHIYAMA, 2020). A ciência de dados pode ser definida como processos, modelos e tecnologias utilizadas para o estudo dos dados desde a produção até o descarte (AMARAL, 2016). A ciência de dados se consiste em várias etapas. Nos parágrafos seguintes serão abordadas as etapas de armazenamento, transformação e mineração dos dados. Antes da análise, os dados produzidos são armazenados em data marts que são bancos de dados específicos onde dados relevantes são armazenados para a extração do conhecimento (TATIANA; KOSHIYAMA, 2020). Os data marts podem estar agrupados em um armazém de dados comumente chamado de data warehouse (AMARAL, 2016). Geralmente, cada data mart está relacionado a um setor ou grupo de setores de um determinado negócio (AMARAL, 2016). A Figura 1 mostra um exemplo de uma estrutura de data warehouse dividido em data marts. Figura 1 - Estrutura de um data warehouse(AMARAL, 2016, p. 41). Depois do armazenamento, os dados dão transformados por ferramentas de Extração, Transformação e Carga (ETL - Extraction, Transformation and Loading) (TATIANA; KOSHIYAMA, 2020). As etapas seguintes já compreendem o 7 processamento e escolha de modelos que melhor se adequem aos problemas que se pretende conhecer. Para obter conhecimento através dos dados, foram criadas técnicas que possibilitam verificar padrões e a probabilidade desses padrões se repetirem de forma generalizada. Essas técnicas são chamadas de Mineração de Dados (Data Mining) (TATIANA; KOSHIYAMA, 2020). As fontes dos dados podem ser das mais variadas possíveis, por exemplo, sistemas de vendas, redes sociais, sistemas de monitoramento, sistemas de transporte, serviços de streaming etc. A tecnologia de armazenamento desses dados também é variada. Os dados podem estar armazenados em bancos de dados relacionais, planilhas, arquivos de texto etc. Por causa dessa mescla na forma de armazenamento dos dados, houve a necessidade de classificá-los em dados estruturados, semiestruturados e não estruturados (AMARAL, 2016). Os dados estruturados são os dados que estão armazenados em estruturas de linhas e colunas e com uma forte tipagem. Exemplo de dados estruturados são os Sistemas de Gerenciamento de Banco de Dados (SGBDs) e planilhas (AMARAL, 2016). Já os dados semiestruturados são dados cujo armazenamento é feito numa estrutura pré- definida, mas que pode sofrer alguma alteração quando há inserções, remoções ou atualizações. São exemplos de dados semiestruturados os arquivos XML, JSON (AMARAL, 2016). Por último, os dados não estruturados são dados que não possuem armazenamento com uma estrutura definida. Esses dados são representados por arquivos de textos, documentos PDF, páginas da web, redes sociais etc. O conjunto de dados estruturados, semiestruturados e não estruturados utilizados para obter conhecimento é chamado de Big Data. Amaral (2016, p. 7) define Big Data como “fenômeno em que dados são produzidos em vários formatos e armazenados por uma grande quantidade de dispositivos e equipamentos”. Embora o termo dê somente uma ideia volume, Big Data tem mais de uma característica (MARQUESONE, 2016). Essas características são atualmente chamadas de 5 V’s: volume, velocidade, variedade, veracidade e valor. Muitos autores mencionam apenas 3 V’s como características: volume, velocidade e variedade (MARQUESONE, 2016). Segundo Marquesone (2016) “O atributo volume é a característica mais significativa no conceito de Big Data.”. O volume em Big Data não indica apenas um valor fixo de bytes armazenados em um sistema, mas indica se o volume armazenado pode ser tratado por ferramentas tradicionais (MARQUESONE, 2016). Por exemplo, 8 um SGBD utilizado em um determinado setor tem capacidade de processar vários gigabytes de dados, mas caso essa quantidade chegue a alguns terabytes, o processo ficará lento. Nesse caso, é necessário a utilização de ferramentas que contenham mais poder de processamento que, em geral, utilizam processamento distribuído, aumentando a velocidade de processamento dos dados. A característica variedade foi atribuída pelo motivo de sistemas que implementam Big Data processar dados estruturados, semiestruturados e não estruturados (MARQUESONE, 2016). A velocidade é outra característica importante em Big Data. Com a necessidade de transformar e analisar um grande volume de dados variados, sistemas de Big Data contam com recursos de computação distribuída que utilizam ferramentas como o Hadoop e o Spark no tratamento, armazenamento e consulta dos dados. A veracidade é um atributo que caracteriza a confiabilidade dos dados escolhidos para o sistema de Big Data (MARQUESONE, 2016). Já o valor está relacionado à importância do dado no sistema de Big Data (MARQUESONE, 2016), ou seja, o dado tem que ser relevante para a análise, extração de conhecimento e tomada de decisão (TATIANA; KOSHIYAMA, 2020). 3. Ciência de dados e Big Data na pandemia de COVID-19 Ao buscartermos relacionados à ciência de dados e Big Data no combate à pandemia COVID-19 em sites de buscas acadêmicas como o a Scielo.org e o Google Acadêmico, foi possível encontrar algumas implementações e estudos realizados acerca do tema. Nos parágrafos abaixo serão abordados algumas implementações e estudos importantes para o combate da pandemia de COVID-19 utilizando a ciência de dados e Big Data. A Coreia do Sul implementou um sistema chamado COVID-19 Smart Management System (COVID-19 SMS) para monitorar o movimento das pessoas com COVID-19, extraindo dados de filmagens de câmeras de segurança, cartões de créditos e GPS (LIN; HOU, 2020). Ao identificar que uma pessoa pôde ter sido exposta ao vírus da COVID-19, os funcionários do Korea Center for Disease Control & Prevention (KCDC), “Centro Coreano para Controle e Prevenção de Doenças” em português, enviam uma mensagem a essa pessoa notificando a possível exposição 9 (LIN; HOU, 2020). Lançado em 26 de maro de 2020, o COVID-19 SMS teve como base a plataforma City Data Hub que foi desenvolvido para análise do tráfego, consumo de energia, meio ambiente e segurança em cidades inteligentes (LEE, D.; LEE, J., 2020). A Figura 2 ilustra o processo de análise do sistema COVID-19 SMS. Figura 2 – processo de análise do sistema COVID-19 SMS (LEE, S., 2020). O sistema COVID-19 SMS trouxe vantagens para o sistema de saúde da Coreia do Sul. Os principais benefícios foram (LEE, S., 2020): a) análise do movimento dos casos confirmados – manualmente os funcionários do sistema de saúde demoravam cerca de 24 horas para analisar os casos, mas com a implantação do sistema, a análise automática era concluída em cerca de 10 minutos; b) gerenciamento dos acessos às informações pessoais por meio de registros digitais – antes do sistema, todas as informações dos indivíduos eram escritas à mão; c) coordenação entre as organizações – as informações passaram a ser trocadas em tempo real. Na China, devido ao grande volume de pessoas, a necessidade de coletar dados de temperatura, de históricos de viagens em pontos de entradas e saídas das 10 cidades, de entradas nos tráfegos principais e nos aeroportos implicou na criação de um programa chamado QR Health Code (LIN; HOU, 2020). O QR Healh Code foi criado pela gigante do comércio eletrônico Alibaba em parceria com a cidade de Hangzhou, um dia após seu confinamento (CARNAP; DRINHAUSEN; SHI-KUPFER, 2020). Em pouco tempo, o aplicativo já tinha sido instalado em quase todos os 900 milhões de usuários de internet na China (CARNAP; DRINHAUSEN; SHI-KUPFER, 2020). Segundo Lin e Hou (2020), utilizando Inteligência Artificial (IA) e algoritmos de aprendizagem de máquina, o QR Health Code cruza os dados de autoavaliação da pessoa em relação ao seu estado de saúde, dos históricos de viagens utilizando Big Data da aviação, dos sistemas rodoviários e ferroviários, das redes sociais, da base de dados da COVID-19, de GPS e dos registros de pagamentos para rastrear os movimentos da pessoa infectada e de outras próximas a ela. O sistema armazena em códigos QR uma espécie de certificado de avaliação de saúde da pessoa (CARNAP; DRINHAUSEN; SHI-KUPFER, 2020). Ao escanear o código QR, três possíveis resultados para o risco individual podem ser encontrados: baixo, médio e alto (LIN; HOU, 2020). Um indicador no aplicativo móvel mostra o nível de risco da pessoa. O nível baixo é representado pela cor verde e indica que a pessoa Figura 3 – Diagrama do sistema QR Health Code da China (CARNAP; DRINHAUSEN; SHI-KUPFER, 2020). 11 está livre para circular. O nível médio é representado pela cor amarela e a pessoa deve ficar de quarentena por 7 dias. Por último, a cor vermelha indica o nível alto, e, nesse caso, a pessoa deve ficar de quarentena por 14 dias (LIN; HOU, 2020). A Figura 3 ilustra um diagrama do sistema QR Health Code. Em vários estabelecimentos, transportes públicos e conjuntos habitacionais, a apresentação do código QR tornou- se obrigatória. Em março de 2020, Zohu et al. (2020) propuseram um sistema que integra o Sistema de Informação Geográfica (SIG) a sistemas de Big Data de diversas fontes no intuito de mapear a evolução da pandemia de COVID-19 na China. No estudo de Zohu et al. (2020) foram analisadas a representação espacial da doença, população e psicologia social em três escalas: individual, por grupo e por região. Na escala individual, os movimentos dos indivíduos no espaço e no tempo foram mapeados e comparados com o movimento no espaço da pandemia. Na escala por grupo, foram estimados o fluxo populacional e a distribuição da população no espaço. Na escala regional, o estudo segmentou o risco espacial, analisou o balanço entre a disponibilidade de recursos médicos e a demanda por eles. Para que o sistema pudesse ser integrado, foram necessárias as seguintes etapas (ZOHU et al., 2020): a) conectar os departamentos de saúde na internet; b) construir uma base de dados multidimensional utilizando o modelo de cubo espaço-temporal para Big Data da pandemia; c) criar uma ferramenta para a análise dos dados para tomada de decisão; d) desenvolver o SIG online para visualização espaço-temporal, navegando geograficamente através das operações slice and dice (fatiar e cortar) sobre o país, província, cidade, condado, comunidade e indivíduo (ZOHU et al., 2020). Também em março de 2020, nos Estados Unidos, Magar, Yadav e Farimani (2020) utilizaram aprendizagem de máquina para buscar potenciais anticorpos que pudessem neutralizar a ação do coronavírus. A expansão de dados biológicos, em especial os de DNA, tornou possível a predição de fenômenos biológicos por meio da aprendizagem de máquina. Segundo os autores, a máquina poderia prever anticorpos com maior potencial de neutralização de um determinado vírus. Foram utilizados dados de sequenciamento genético de vários vírus como o HIV, dengue e SARS. Com esses dados, foram executados treinamentos para que pudesse ser selecionado o 12 melhor modelo de aprendizado de máquina. Após o processo de aprendizagem, foi possível identificar oito tipos de anticorpos que poderiam neutralizar a COVID-19. No Brasil, a Fundação Oswaldo Cruz (Fiocruz) criou um sistema de Big Data chamado MonitoraCovid-19. Este sistema coleta dados de diversas fontes (FIOCRUZ, 2021) e os consolidam possibilitando que as pessoas visualizem em painéis a evolução e a movimentação da doença pelo país. Segundo a Fiocruz (2021) as informações coletadas pelo sistema “possibilitam desenvolver modelos preditivos adequados à realidade nacional, capazes de informar ações de contenção e tratamento”. As principais fontes de dados para o sistema são (FIOCRUZ, 2021): a) Johns Hopkins University Center for Systems Science and Engineering (JHU CCSE) – contém arquivos no formato comma-separated values (CSV), valores separados por vírgulas em português, com informações sobre a pandemia pelo mundo; b) Ministério da Saúde – são obtidos os dados dos estados e munícipios pelo sistema Covid MS; c) Universidade de Maryland – em parceria com o Facebook, professores da universidade coletam resultados de pesquisas feitas por formulários nos aplicativos do Facebook que perguntam se há casos de pessoas com sintomas semelhantes à da COVID-19 em suas casas, e, com estes dados, é estimada a porcentagem de pessoas em uma região com sintomas semelhantes aos da COVID-19 e os da influenza (BARKAY et al., 2020); d) Waze através do IDB Coronavirus Impact Dashboard - o IDB Coronavirus Impact Dashboard é um painel criado pela Inter-American Development Bank (IDB) que tem por objetivo acompanhar os impactos do coronavírus nos países da América Latina e do Caribe obtendo dados do transporte público, congestionamento e casos de COVID-19 desses países (IDB, 2021); e) Projeto Google COVID-19 Community Mobility Report – disponibilizarelatórios que fornecem dados em arquivos CSV e Portable Document Format (PDF) das mudanças ocorridas (no varejo, lazer, mercados, transporte público, etc.) em diversas regiões do mundo em meio às políticas de combate à pandemia (GOOGLE, 2021); f) Moovit Public Transit Index – fornece estatísticas do transporte público pelo mundo (FIOCRUZ, 2021). 13 Conclusões Este artigo teve como objetivo descrever implementações e/ou estudos realizados no combate à pandemia de COVID-19 utilizando a ciência de dados e Big Data como ferramentas para análises e tomadas de decisões. Embora as tecnologias utilizadas na ciência de dados e em Big Data tenham avançado nos últimos anos, elas não foram capazes de prever a pandemia de COVID- 19. Embora não tenha conseguido prever a doença, os estudos e implementações utilizando essas tecnologias durante a pandemia foram muito importantes. Na primeira sessão, este artigo apresentou uma breve história da pandemia de COVID-19, desde o seu surgimento até a aparição das novas mutações do vírus. Na segunda sessão foi apresentado, de forma sintetizada, o conceito de ciência de dados e Big Data. Já na terceira sessão, o artigo descreveu algumas implementações e pesquisas feitas utilizando ciência de dados e Big Data. Na pesquisa, foi possível verificar que a aplicação da ciência de dados e Big Data no combate à pandemia se mostrou importante. Foram encontrados sistemas que utilizam reconhecimento facial, dados de GPS, dados de pagamentos e outros para rastrear os movimentos dos indivíduos. Este artigo abrange o sistema chinês QR Health Code que utiliza código QR para indicar o risco de exposição de um indivíduo à COVID-19. Também foi encontrado um estudo que utilizou a ciência de dados e Big Data das bases de dados de DNA pelo mundo para gerar modelos computacionais que pudessem selecionar anticorpos capazes de neutralizarem o SARS-CoV-2. Este artigo conclui que a ciência de dados e Big Data são ferramentas essenciais nas tomadas de decisões e pesquisas envolvendo grandes volumes de dados, fatores que estão presentes em uma pandemia como a da COVID-19. Sem essas tecnologias, os processos de combate à pandemia seriam mais lentos, já que demandam muitas informações em diversas fontes, e o trabalho manual seria dispendioso e ineficiente. 14 Referências AMARAL, F. Introdução à ciência de dados: mineração de dados e Big Data. Rio de Janeiro: Alta Books, 2016. BADDINI, Bruna; FERNANDES, Daniel. Primeira pessoa é vacinada contra Covid- 19 no Brasil. CNN Brasil, São Paulo, 17 jan. 2021. Disponível em: https://www.cnnbrasil.com.br/nacional/2021/01/17/primeira-pessoa-e-vacinada- contra-covid-19-no-brasil. Acesso em: 13 mar. 2021. BARKAY, Neta; COBB, Curtiss; EILAT, Roee; GALILI, Tal; HAIMOVICH, Daniel; LAROCCA, Sarah; MORRIS, Katherine; SARIG, Tal. Weights and Methodology Brief for the COVID-19 Symptom Survey by University of Maryland and Carnegie Mellon University, in Partnership with Facebook. Facebook Research, out. 2020. BOYD, danah; CRAWFORD, Kate. CRITICAL QUESTIONS FOR BIG DATA: Provocations for a cultural, technological, and scholarly phenomenon. Londres, Information, Communication & Society, 10 mai. 2012. CARNAP, Kai von; DRINHAUSEN, Katja; SHI-KUPFER, Kristin. TRACING. Testing. Tweaking: Approaches to data-driven Covid-19 management in China. MERICS - Mercator Institute for China Studies, 24 jun. 2020, Disponível em: https://merics.org/en/report/tracing-testing-tweaking. Acesso em: 14 fev. 2021. CHINA tem 1ª morte por misteriosa pneumonia viral. G1. [S.I.], 11 jan. 2020. Disponível em: https://g1.globo.com/mundo/noticia/2020/01/11/china-tem-1a-morte- por-misteriosa-pneumonia-viral.ghtml. Acesso em: 05 fev. 2021. CORONAVÍRUS (COVID-19). Google Notícias. [S.I.], 23 fev. 2021. Disponível em: https://news.google.com/covid19/map. Acesso em: 23 fev. 2021. COVID-19: Brasil passa Itália e Espanha em casos e supera 15 mil mortes. UOL. [S.I.], 16 mai. 2020. Disponível em: https://noticias.uol.com.br/saude/ultimas- noticias/redacao/2020/05/16/casos-e-obitos-coronavirus-brasil-16-de-maio.htm. Acesso em: 23 fev. 2021. COVID em Manaus: nova variante pode estar por trás de caos no Amazonas, dizem pesquisadores. BBC Brasil. [S.I.], 15 jan. 2021. Disponível em: https://www.bbc.com/portuguese/brasil-55677738. Acesso em: 16 mar. 2021. ESCOVEDO, Tatiana; KOSHIYAMA, Adriano. Introdução a Data Science: Algoritmos de Machine Learning e métodos de análise. São Paulo: Casa do Código, 2020. 288 p. ISBN 8572540555, 9788572540551. https://www.cnnbrasil.com.br/nacional/2021/01/17/primeira-pessoa-e-vacinada-contra-covid-19-no-brasil https://www.cnnbrasil.com.br/nacional/2021/01/17/primeira-pessoa-e-vacinada-contra-covid-19-no-brasil https://news.google.com/covid19/map https://noticias.uol.com.br/saude/ultimas-noticias/redacao/2020/05/16/casos-e-obitos-coronavirus-brasil-16-de-maio.htm https://noticias.uol.com.br/saude/ultimas-noticias/redacao/2020/05/16/casos-e-obitos-coronavirus-brasil-16-de-maio.htm https://www.bbc.com/portuguese/brasil-55677738 15 ESTADOS UNIDOS confirmam primeiro caso de coronavírus próximo à fronteira com o México. O Estado de S. Paulo. São Paulo, [S.I.], 11 fev. 2020. Disponível em: https://saude.estadao.com.br/noticias/geral,estados-unidos-confirmam-primeiro- caso-de-coronavirus-proximo-a-fronteira-com-o-mexico,70003193208. Acesso em: 22 fev. 2021. ESTADOS Unidos superam Itália como o país com mais mortos por coronavírus. O Globo. [S.I.], 11 abr. 2020. Disponível em: https://oglobo.globo.com/mundo/estados- unidos-superam-italia-como-pais-com-mais-mortos-por-coronavirus-24365827. Acesso em: 05 fev. 2021. EUA realizam primeiro teste de vacina contra o coronavírus em humanos. G1. [S.I.], 17 mar. 2020. Disponível em: https://g1.globo.com/bemestar/coronavirus/noticia/2020/03/17/eua-realiza-primeiro- teste-de-vacina-contra-o-coronavirus-em-humanos.ghtml. Acesso em: 25 fev. 2021. FIOCRUZ. Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (ICICT). MonitoraCovid-19. Rio de Janeiro, 2020. Disponível em: https://bigdata-covid19.icict.fiocruz.br/. Acesso em 13 fev. 2021. FRANÇA é o primeiro país da Europa a registrar caso do novo coronavírus. Jornal Nacional. [S.I.], 24 jan. 2020. Disponível em: https://g1.globo.com/jornal- nacional/noticia/2020/01/24/franca-e-o-primeiro-pais-da-europa-a-registrar-caso-do- novo-coronavirus.ghtml. Acesso em: 22 fev. 2021. GALLEGO, Inmaculada; FONT, Xavier. Changes in air passenger demand as a result of the COVID-19 crisis: using Big Data to inform tourism policy. Journal of Sustainable Tourism, mai. 2020. ISSN: 0966-9582. GOOGLE. COVID-19: Relatórios de mobilidade da comunidade. Disponível em: https://www.google.com/covid19/mobility/. Acesso em: 11 mar. 2021. IDB. CORONAVIRUS IMPACT DASHBOARD. Disponível em: https://www.iadb.org/en/topics-effectiveness-improving-lives/coronavirus-impact- dashboard. Acesso em: 11 mar. 2021. ITÁLIA confirma primeiros casos de coronavírus no país. G1. [S.I.], 30 jan. 2020. Disponível em: https://g1.globo.com/ciencia-e-saude/noticia/2020/01/30/italia- confirma-primeiros-casos-de-coronavirus-no-pais.ghtml. Acesso em: 22 fev. 2021. LEE, David; LEE, Jaehong. Testing on the move: South Korea's rapid response to the COVID-19 pandemic. Daejeon, ELSEVIER, v. 5, mai. 2020. LEE, Sanghoon. COVID-19 Smart Management System (SMS) in Korea. Korea Agency of Infrastructure Technology Advancement, 2020. Slides. Disponível em: COVID-19: Smart Management System (SMS) in the Republic of Korea | ADB Knowledge Event Repository (development.asia). Acesso em: 16 mar. 2021. LIN, Leesa; HOU, Zhiyuan. Combat COVID-19 with artificial intelligence and Big Data. Londres, Journal of Travel Medicine, vol. 27, mai. 2020. https://saude.estadao.com.br/noticias/geral,estados-unidos-confirmam-primeiro-caso-de-coronavirus-proximo-a-fronteira-com-o-mexico,70003193208https://saude.estadao.com.br/noticias/geral,estados-unidos-confirmam-primeiro-caso-de-coronavirus-proximo-a-fronteira-com-o-mexico,70003193208 https://g1.globo.com/bemestar/coronavirus/noticia/2020/03/17/eua-realiza-primeiro-teste-de-vacina-contra-o-coronavirus-em-humanos.ghtml https://g1.globo.com/bemestar/coronavirus/noticia/2020/03/17/eua-realiza-primeiro-teste-de-vacina-contra-o-coronavirus-em-humanos.ghtml https://g1.globo.com/jornal-nacional/noticia/2020/01/24/franca-e-o-primeiro-pais-da-europa-a-registrar-caso-do-novo-coronavirus.ghtml https://g1.globo.com/jornal-nacional/noticia/2020/01/24/franca-e-o-primeiro-pais-da-europa-a-registrar-caso-do-novo-coronavirus.ghtml https://g1.globo.com/jornal-nacional/noticia/2020/01/24/franca-e-o-primeiro-pais-da-europa-a-registrar-caso-do-novo-coronavirus.ghtml https://www.google.com/covid19/mobility/ https://www.iadb.org/en/topics-effectiveness-improving-lives/coronavirus-impact-dashboard https://www.iadb.org/en/topics-effectiveness-improving-lives/coronavirus-impact-dashboard https://g1.globo.com/ciencia-e-saude/noticia/2020/01/30/italia-confirma-primeiros-casos-de-coronavirus-no-pais.ghtml https://g1.globo.com/ciencia-e-saude/noticia/2020/01/30/italia-confirma-primeiros-casos-de-coronavirus-no-pais.ghtml https://events.development.asia/materials/20200422/covid-19-smart-management-system-sms-republic-korea https://events.development.asia/materials/20200422/covid-19-smart-management-system-sms-republic-korea 16 MAGAR, Rishikesh; YADAV, Prakars; FARIMANI, Amir Barati. Potential Neutralizing Antibodies Discovered for Novel Corona Virus Using Machine Learning. Disponível em: https://arxiv.org/ftp/arxiv/papers/2003/2003.08447.pdf. Acesso em: 08 fev. 2021. 18 mar. 2020. MARQUESONE, Rosangela. Big Data: Técnicas e tecnologias para extração de valor dos dados. São Paulo: Editora Casa do Código, 2016. 220 p. ISBN 8555192323, 9788555192326. MÁXIMO, Wellton. Por unanimidade, Anvisa aprova uso emergencial de vacinas contra covid. Agência Brasil, Brasília, 17 jan. 2021. Disponível em: https://agenciabrasil.ebc.com.br/saude/noticia/2021-01/por-unanimidade-anvisa- aprova-uso-emergencial-de-vacinas-contra-covid. Acesso em: 13 mar. 2021. MINISTÉRIO DA SAÚDE (Brasil). Painel Coronavírus. Brasília, 2021. Disponível em: https://covid.saude.gov.br/. Acesso em: 23 fev. 2021. NOVA variante do coronavírus é detectada na África do Sul. G1. [S.I.], 18 dez. 2020. Disponível em: https://g1.globo.com/bemestar/coronavirus/noticia/2020/12/18/nova- variante-do-coronavirus-e-detectada-na-africa-do-sul.ghtml. Acesso em: 16 mar. 2021. NÚMERO de mortos na Itália ultrapassa 10 mil; infectados já são mais de 92 mil. O Globo. [S.I], 28 mar. 2020. Disponível em: https://oglobo.globo.com/mundo/numero- de-mortos-na-italia-ultrapassa-10-mil-infectados-ja-sao-mais-de-92-mil-24335690. Acesso em: 14 mar. 2021. PEDUZZI, Pedro. Países da Europa começam a aplicar vacina da Pfizer contra covid-19. Agência Brasil, Brasília, 27 dez. 2020. Disponível em: https://agenciabrasil.ebc.com.br/internacional/noticia/2020-12/paises-da-europa- comecam-aplicar-vacina-da-pfizer-contra-covid-19. Acesso em: 13 mar. 2021. PESQUISADORES e empresas anunciam testes experimentais de vacinas contra a Covid-19. G1. [S.I.], 30 mar. 2020. Disponível em: https://g1.globo.com/bemestar/coronavirus/noticia/2020/03/30/pesquisadores-e- empresas-anunciam-testes-experimentais-de-vacinas-contra-a-covid-19.ghtml. Acesso em: 25 fev. 2021. PHAM, Quoc-Viet; NGUYEN, Dinh C.; HUYNH-THE, Thien; HWANG, Won-Joo; PATHIRANA, Pubudu N. Artificial Intelligence (AI) and Big Data for Coronavirus (COVID-19) Pandemic: A Survey on the State-of-the-Arts. Preprints, abr. 2020. REINO Unido diz ter localizado variante do coronavírus que pode estar associada a aumento de casos. G1. [S.I], 14 dez. 2020. Disponível em: https://g1.globo.com/bemestar/coronavirus/noticia/2020/12/14/reino-unido-diz-ter- localizado-variante-do-coronavirus-que-pode-estar-associada-a-aumento-de- casos.ghtml. Acesso em 16 mar. 2021. https://arxiv.org/ftp/arxiv/papers/2003/2003.08447.pdf https://agenciabrasil.ebc.com.br/saude/noticia/2021-01/por-unanimidade-anvisa-aprova-uso-emergencial-de-vacinas-contra-covid https://agenciabrasil.ebc.com.br/saude/noticia/2021-01/por-unanimidade-anvisa-aprova-uso-emergencial-de-vacinas-contra-covid https://covid.saude.gov.br/ https://g1.globo.com/bemestar/coronavirus/noticia/2020/12/18/nova-variante-do-coronavirus-e-detectada-na-africa-do-sul.ghtml https://g1.globo.com/bemestar/coronavirus/noticia/2020/12/18/nova-variante-do-coronavirus-e-detectada-na-africa-do-sul.ghtml https://oglobo.globo.com/mundo/numero-de-mortos-na-italia-ultrapassa-10-mil-infectados-ja-sao-mais-de-92-mil-24335690 https://oglobo.globo.com/mundo/numero-de-mortos-na-italia-ultrapassa-10-mil-infectados-ja-sao-mais-de-92-mil-24335690 https://agenciabrasil.ebc.com.br/internacional/noticia/2020-12/paises-da-europa-comecam-aplicar-vacina-da-pfizer-contra-covid-19 https://agenciabrasil.ebc.com.br/internacional/noticia/2020-12/paises-da-europa-comecam-aplicar-vacina-da-pfizer-contra-covid-19 https://g1.globo.com/bemestar/coronavirus/noticia/2020/03/30/pesquisadores-e-empresas-anunciam-testes-experimentais-de-vacinas-contra-a-covid-19.ghtml https://g1.globo.com/bemestar/coronavirus/noticia/2020/03/30/pesquisadores-e-empresas-anunciam-testes-experimentais-de-vacinas-contra-a-covid-19.ghtml https://g1.globo.com/bemestar/coronavirus/noticia/2020/12/14/reino-unido-diz-ter-localizado-variante-do-coronavirus-que-pode-estar-associada-a-aumento-de-casos.ghtml https://g1.globo.com/bemestar/coronavirus/noticia/2020/12/14/reino-unido-diz-ter-localizado-variante-do-coronavirus-que-pode-estar-associada-a-aumento-de-casos.ghtml https://g1.globo.com/bemestar/coronavirus/noticia/2020/12/14/reino-unido-diz-ter-localizado-variante-do-coronavirus-que-pode-estar-associada-a-aumento-de-casos.ghtml 17 RÚSSIA anuncia primeira vacina contra a covid-19. Agência Brasil. [S.I.], 11 ago. 2020. Disponível em: https://agenciabrasil.ebc.com.br/internacional/noticia/2020- 08/russia-anuncia-primeira-vacina-contra-covid-19. Acesso em: 25 fev. 2021. SÁ, D. M. Especial Covid-19: Os historiadores e a pandemia. FIOCRUZ, 18 set. 2020; Disponível em: http://www.coc.fiocruz.br/index.php/pt/todas-as-noticias/1853- especial-covid-19-os-historiadores-e-a-pandemia.html#.YB3UR3lv-Uk. Acesso em: 05 fev. de 2021. VEJA quais países iniciaram a vacinação contra a Covid-19; Brasil está fora. CNN Brasil. [S.I.], 24 dez. 2020. Disponível em: https://www.cnnbrasil.com.br/saude/2020/12/24/quais-os-paises-que-ja-comecaram- a-vacinacao-contra-a-covid-19. Acesso em: 13 mar. 2021. ZOHU, Chenghu; SU, Fenzhen; PEI, Tao; ZHANG, An; DU, Yunyan; LUO, Bin; CAO, Zhidong; WANG, Juanle; YUAN, Wen; ZHU, Yunqiang; SONG, Ci; CHEN, Jien; XU, Jun; LI, Fujia; MA, Ting; JIANG, Lili; YAN, Fengqin; YI, Jiawei; HU, Yunfeng; LIAO, Yilan; XIAO, Han. COVID-19: Challenges to GIS with Big Data. Geography and Sustainability, Beijing, v. 1, p. 77-88, mar. 2020. ISSN 2666-6839. http://www.coc.fiocruz.br/index.php/pt/todas-as-noticias/1853-especial-covid-19-os-historiadores-e-a-pandemia.html#.YB3UR3lv-Uk http://www.coc.fiocruz.br/index.php/pt/todas-as-noticias/1853-especial-covid-19-os-historiadores-e-a-pandemia.html#.YB3UR3lv-Uk https://www.cnnbrasil.com.br/saude/2020/12/24/quais-os-paises-que-ja-comecaram-a-vacinacao-contra-a-covid-19 https://www.cnnbrasil.com.br/saude/2020/12/24/quais-os-paises-que-ja-comecaram-a-vacinacao-contra-a-covid-19
Compartilhar