Prévia do material em texto
BUSINESS ANALYTICS E ROADMAPS POR DATA-DRIVEN ERIC BACCONI GONÇALVES Sumário AULA 1 INTRODUÇÃO – DATA SCIENCE .......................4 AULA 2 DATA SCIENCE E ESTRATÉGIA DE NEGÓCIOS .................................................11 AULA 3 CULTURA DATA-DRIVEN .................................20 AULA 4 BUSINESS INTELLIGENCE ...............................28 AULA 5 BUSINESS ANALYTICS ....................................39 AULA 6 BIG DATA .........................................................48 AULA 7 DATA MINING I ...............................................58 AULA 8 DATA MINING II ..............................................65 AULA 9 PROBLEM SOLVING ........................................75 AULA 10 DASHBOARD ...................................................84 AULA 11 STORYTELLING COM DADOS .........................94 AULA 12 ELEMENTO HUMANO E PRIVACIDADE.......106 AULA 1 INTRODUÇÃO – DATA SCIENCE Inicialmente, vamos analisar a Figura 1. Esta é a chamada pirâmide DICS, sigla de Dados, Informação, Conhecimento e Sabedoria. 5 FIGURA 1 – PIRÂMIDE DICS DADOS INFORMAÇÃO CONHECIMENTO SABEDORIA 1 Fonte: MUNDO DA LÓGICA. Sabedoria X Conhecimento X Informação X Dados. Mundo da Lógica, [s. l.], 4 mar. 2013. Disponível em: https://mundodalogica.wordpress. com/2013/03/04/sabedoria-x-conhecimento-x-informacao-x- dados-2/. Acesso em: 8 mar. 2021. DADOS – são a base da pirâmide, provenientes de uma coleta ou pesquisa. INFORMAÇÃO – a informação surge a partir da estruturação ou organização de dados processados para um fim/contexto específico. CONHECIMENTO – é composto por uma mescla de informação contextualizada, valores experiências e regras. SABEDORIA – é o estágio mais complexo, acrescenta o entendimento de quando se utilizar o conhecimento. 6 https://mundodalogica.wordpress.com/2013/03/04/sabedoria-x-conhecimento-x-informacao-x-dados-2/ https://mundodalogica.wordpress.com/2013/03/04/sabedoria-x-conhecimento-x-informacao-x-dados-2/ https://mundodalogica.wordpress.com/2013/03/04/sabedoria-x-conhecimento-x-informacao-x-dados-2/ Essa pirâmide representa o dia a dia das empresas. Elas possuem uma grande quantidade de dados, que devem ser trabalhados para gerar informações, conhecimento e sabedoria para a empresa. Neste contexto, é muito importante o conceito de data science, ou ciência de dados, em português. CIÊNCIA DE DADOS Com grandes quantidades de dados agora disponí- veis, as empresas de quase todos os setores estão focadas na exploração de dados para vantagem competitiva. O volume e a variedade de dados ultra- passaram em muito a capacidade de análise manual e, em alguns casos, ultrapassaram a capacidade das bases de dados convencionais. Ao mesmo tempo, os computadores se tornaram muito mais poderosos. A rede é onipresente e algo- ritmos foram desenvolvidos para conectar conjun- tos de dados a fim de permitir análises mais amplas e profundas. A convergência desses fenômenos deu origem a uma cada vez maior aplicação da ciência de dados nas empresas. Empresas de todos os setores perceberam que pre- cisam contratar mais cientistas de dados, instituições acadêmicas estão cada vez mais criam cursos para for- mação de cientistas de dados. Atualmente, é consenso que ciência de dados é uma carreira promissora. 7 DEFINIÇÕES Data science está intrinsecamente interligada a ou- tros conceitos importantes, como big data ou data- driven (conceitos que serão abordados ao longo do curso), que também estão crescendo em importân- cia e atenção. Data science é um conjunto de princípios fundamentais que apoiam e orientam a extra- ção de informações com o objetivo de buscar conhecimento. Esses princípios e técnicas são amplamente aplicados em áreas funcionais em negócios. Provavelmente a área que mais utiliza essas técnicas é a de Marketing, sobretudo em suas subáreas, como publicidade, retenção de clientes e recomendações para venda cruzada. Entretanto, a ciência de dados também é aplicada em outros campos, como Finanças, detec- ção de Fraudes, Medicina, entre outros. Ciência de dados envolve muito mais do que apenas mineração de dados algoritmos. Cientistas de dados bem-sucedidos devem ser capazes de visualizar pro- blemas de negócios sob a perspectiva de dados. Grande parte do que tem sido tradicionalmente es- tudado no campo da estatística é fundamental para a 8 ciência de dados, métodos e metodologia para visua- lizar os dados são vitais. Há também áreas particula- res em que intuição, criatividade, comum sentido e conhecimento de uma determinada aplicação devem ser também trazidos para análise. Uma perspectiva de ciência de dados fornece aos profissionais suporte e princípios que oferecem ao cientista de dados uma base para tratar sistematicamente dos problemas, extraindo conhecimento útil dos dados. Exemplo Suponha que você conseguiu um ótimo trabalho analítico em uma empresa de telecomunicações chamada MegaTelCo, a qual está tendo um grande problema com a retenção de clientes em seus ne- gócios sem fio e está ficando cada vez mais difícil adquirir novos clientes. O mercado de telefonia celular está saturado após o enorme crescimento do mercado sem fio há alguns anos. Empresas de comunicação estão agora envol- vidas em batalhas para atrair novos clientes e man- tendo os que já possuem. A mudança de clientes de uma empresa para outra é chamada de churn e é cara: uma empresa deve gastar com incentivos para atrair um cliente, enquanto a outra empresa perde receita quando o cliente lhe deixa. 9 Você foi chamado para ajudar a entender o problema e para conceber uma solução. Atrair novos clientes é muito mais caro do que reter os existentes, portanto, uma boa parte do orçamento de marketing é aloca- da para evitar o churn. O marketing já elaborou uma oferta especial de retenção. Sua tarefa é conceber um plano preciso, passo a passo, de como a equipe de ciência de dados deve usar os vastos recursos que possui para decidir a quais clientes deve oferecer o acordo especial de retenção antes do término de seus contratos. Neste caso específico, decida: qual o melhor conjunto de clientes para direcionar a oferta especial a fim de reduzir o churn usando um orça- mento de incentivo específico? Responder a essa questão é muito mais complicado do que pode parecer inicialmente. REFERÊNCIA BIBLIOGRÁFICA FAWCETT, T.; PROVOST, F. Data science para negócios: o que você precisa saber sobre mineração de dados e pensamento analítico de dados. Rio de Janeiro: Alta Books, 2018. 10 AULA 2 DATA SCIENCE E ESTRATÉGIA DE NEGÓCIOS Nesta aula, vamos discutir sobre a interação entre ciência de dados e estratégia de negócios. Uma confluência de fatores levou as empresas con- temporâneas a serem incrivelmente ricas em dados em comparação com suas antecessoras. Entretanto, 12 a disponibilidade de dados por si só não garante o sucesso na tomada de decisão baseada em dados. Como uma empresa garante que irá obter o máximo da riqueza de dados? São dois os fatores principais: a gestão da empresa deve pensar em dados analiti- camente e a criar uma cultura de ciência de dados. Isso não significa que os gestores precisam ser cientistas de dados. Contudo, os gerentes têm que entender os princípios fundamentais bem o sufi- ciente para aproveitar as oportunidades da ciência de dados, fornecer os recursos apropriados para os dados e estarem disposto a investir em dados e inovações. Além disso, a gestão deve orientar a equipe de ciên- cia de dados com cuidado para se certificar de que ela permanece no caminho certo para uma solução de negócios eventualmente útil. Isso é muito difícil se os gerentes não entendem realmente os prin- cípios. Os gestores precisam ser capazes de fazer as perguntas certas para os cientistas de dados a fim de evitar que o analista se perca em detalhes técnicos. Em projetos de ciência de dados uma equipe diver- sificada é essencial. Assim como nãopodemos espe- rar que um gestor necessariamente tenha profundo conhecimento sobre dados, não podemos esperar 13 que um cientista de dados necessariamente tenha profundo conhecimento sobre negócios. No entan- to, uma equipe de ciência de dados eficaz envolve a colaboração entre os dois, e cada um precisa ter algum entendimento dos fundamentos da área de responsabilidade do outro. ALCANÇANDO VANTAGEM COMPETITIVA COM CIÊNCIA DE DADOS Dados e ciência de dados são ativos estratégicos (complementares). Sob quais condições uma em- presa pode obter vantagem competitiva com esses ativos? Primeiramente, o ativo deve ser valioso para a em- presa. Isso parece óbvio, mas observe que o valor de um ativo para uma empresa depende de outras decisões estratégicas que ela toma. Portanto, um pré-requisito para a vantagem competitiva é que o ativo seja valioso no contexto da estratégia da organização. Falando sobre o segundo conjunto de critérios, para obter vantagem competitiva, os concorrentes não devem possuir o ativo ou não devem ser capazes de obter o mesmo valor do ativo. Devemos pensar 14 sobre o(s) ativo(s) de dados e a capacidade da ciên- cia de dados. Temos um ativo de dados exclusivo? Se não, nós temos um ativo cuja utilização está mais alinhada com nossa estratégia do que com a estratégia de nossos concorrentes? Ou somos mais capazes de tirar proveito do ativo de dados devido à nossa melhor capacidade de ciência de dados? Outro questionamento sobre como obter vantagem competitiva com dados e ciência de dados é se esta- mos em desvantagem competitiva. Pode ser que as respostas para as questões anteriores sejam afirma- tivas para nossos concorrentes e não para nós. MANTENDO VANTAGEM COMPETITIVA COM CIÊNCIA DE DADOS O próximo passo é, uma vez que possuímos vanta- gem competitiva, saber se podemos sustentá-la. Se nossos concorrentes puderem facilmente duplicar nossos ativos e capacidades, nossa vantagem pode ter vida curta. Esta é uma questão especialmente crítica se nossos concorrentes têm mais recursos do que nós: ao adotarmos nossa estratégia, eles po- dem nos ultrapassar se tiverem mais recursos. Uma estratégia para competir com base na ciên- cia de dados é se planejar para sempre manter-se 15 um passo à frente da concorrência, ou seja, estar sempre investindo em novos ativos de dados e desenvolvendo novas técnicas e capacidades. Essa tática pode proporcionar uma experiência positiva, e, possivelmente, rápido crescimento da empresa, mas, geralmente, poucas empresas são capazes de executá-la. Por exemplo, você deve ter certeza de que possui uma das melhores equipes de ciência de dados, uma vez que a eficácia dos cientistas tem grande variação, com o melhor sendo muito mais talentoso do que a média. Se você tem uma grande equipe, pode apostar que você pode se manter à frente da concorrência. Estar sempre um passo adiante é alcançar vantagem competitiva devido à incapacidade do concorrente de replicar, ou ao seu elevado custo para replicação, o ativo de dados ou a capacidade de ciência de da- dos. Há vários caminhos para essa sustentabilidade. VANTAGEM HISTÓRICA Circunstâncias históricas podem ter colocado uma empresa em posição vantajosa, e pode ser muito caro para os concorrentes alcançarem a mesma posição. A Amazon fornece um excelente exemplo. No “boom” das empresas “pontocom”, na década de 16 1990, a Amazon conseguiu vender livros abaixo do custo e os investidores continuaram a apostar na empresa. Isso permitiu que ela acumulasse enor- mes ativos de dados (como dados massivos sobre a compra de consumidores on-line e preferências e análises de produtos on-line), o que lhes permitiu criar valiosos produtos baseados em dados (como recomendações e classificações de produtos). ATIVOS COLATERAIS INTANGÍVEIS EXCLUSIVOS Nossos concorrentes podem não conseguir desco- brir como colocar nossa solução em prática. Com soluções de ciência de dados bem-sucedidas, a fonte real de bom desempenho (por exemplo, com modelagem preditiva eficaz) pode não ser clara. Muitas vezes, não é nítido para um competi- dor como o desempenho é alcançado na prática. Mesmo que nossos algoritmos sejam publicados em detalhes, muitas particularidades de implementa- ção podem ser críticas para obter uma solução que, mesmo que funcione na fase de testes, seja igual- mente eficiente quando colocada em produção. Além disso, o sucesso pode ser baseado em ativos intangíveis, como uma cultura da empresa que é 17 particularmente adequada para a implantação de soluções de ciência de dados. Exemplificando, uma empresa com cultura que abrange a experimenta- ção de negócios e o suporte de decisões baseadas em dados será naturalmente um lugar mais fácil para o sucesso das soluções de ciência de dados. ESTEJA PRONTO PARA ACEITAR IDEIAS CRIATIVAS DE QUALQUER FONTE Uma vez que diferentes atores entendam os princí- pios fundamentais da ciência de dados, o processo de ideias para novas soluções pode vir de qualquer direção, como de executivos examinando novas potenciais linhas de negócios, de diretores que lidam com responsabilidade de lucros e perdas, de gestores que analisam criticamente um processo de negócios e de funcionários com conhecimento detalhado de como funciona exatamente um deter- minado processo de negócios. Os cientistas de dados devem ser incentivados a interagir com os funcionários de toda a empresa, e parte de sua avaliação de desempenho deve ser baseada em quão bem eles produzem ideias para melhorar os negócios a partir da ciência de dados. Aliás, fazer isso pode valer a pena de formas não intencionais: as habilidades de processamento de 18 dados dos cientistas de dados muitas vezes podem ser aplicadas de maneiras não tão sofisticadas, no entanto, podem ajudar outros funcionários que não possuem tais habilidades. Muitas vezes, um gestor pode não ter ideia de quais dados podem ser obti- dos, dados estes que podem ajudar o gestor direta- mente, sem uma ciência de dados sofisticada. REFERÊNCIA BIBLIOGRÁFICA FAWCETT, T.; PROVOST, F. Data science para negócios: o que você precisa saber sobre mineração de dados e pensamento analítico de dados. Rio de Janeiro: Alta Books, 2018. 19 AULA 3 CULTURA DATA-DRIVEN A cultura data-driven, ou cultura orientada por da- dos, consiste basicamente em tomar decisões em- basadas em dados. Ela existe quando uma empresa organiza seus processos e métricas com base em dados reais, fugindo, assim, de decisões embasadas em intuição, instinto, exemplos passados, achismos ou heurísticas. 21 Uma organização orientada a dados é aquela em que os dados críticos de negócios conduzem auto- maticamente suas decisões e ações. Como as decisões não devem ser tomadas: 1. executivos tomam uma decisão e, em seguida, encontram dados para apoiá-lo; 2. confiando no instinto. Como ela deve ser: 1. os dados informam não apenas que uma deci- são precisa ser tomada, mas também, com frequên- cia, qual decisão deve ser tomada; 2. os gerentes devem ser responsáveis por mode- rar a decisão com base no que os dados mostram. Se você puder identificar o que deseja que seus dados informem, é possível capacitá-los para fala- rem com você (e com as pessoas envolvidas) quan- do essas condições de negócios existirem. É preciso valorizar o poder dos dados. Grandes empresas que estão fazendo a diferença no mundo já vivem embasadas na cultura data-driven e sua performance gigante está completamente ligada a decisões guiadas por dados. 22 Os objetivos de um gestor que busca implementar a cultura data-driven devem ser: 1. deixar claro para o seu time, por meio de exem- plos evidentes, a importância dos dados; 2. buscar a cada dia turbinar mais a capacidade analítica de sua empresa; 3. utilizar ferramentas de automação para ter uma fonte de bases de dados; após isso, deve organizar os dados; 4. investir em tecnologias que trarão resultado para seu negócio; tecnologia que nãogera resulta- dos não serve para nada; 5. concentrar-se em profissionais que, em sua essência, já sejam data-driven, mesmo que eles não saibam. Um exemplo significativo de empresa que utiliza muito bem a sua cultura data-driven é a Amazon. A empresa de Jeff Bezos a utiliza para as finalidades detalhadas a seguir. 1. Oferecer ao usuário uma experiência significa- tiva por meio de algoritmos de recomendação, que são construídos a partir da análise comportamental dos clientes, visando oferecer os produtos que mais se encaixam com o perfil dos clientes. Essa tática e o botão de compra em um clique tornaram muito difícil que você saia do site sem comprar algo. 23 2. Ao analisar os dados de sua cadeia logística, a Amazon desenvolveu um modelo preditivo que consegue antecipar as necessidades de mercadorias dos seus depósitos. Dessa forma, ela consegue se preparar para sempre atender aos seus clientes o mais rápido possível, diminuindo os custos logísticos da empresa. 3. A empresa também consegue ser muito mais competitiva, oferecendo seus produtos sempre pelo menor preço. Ao analisar sua grande quantidade de informações, é possível criar uma otimização das ofertas da empresa, entendendo quando e por que existirá menor concorrência em seu mercado. De acordo com o Gartner Group, estabelecer uma cultura data-driven é uma questão de influenciar a mentalidade e os comportamentos de uma orga- nização. Para estabelecer uma mudança de cultura baseada em dados, deve-se envolver as partes inte- ressadas para garantir a adesão e o suporte contí- nuo no tratamento de dados como um ativo, e não como um subproduto. Para atingir esse objetivo, os líderes da cultura data-driven precisam mostrar liderança em três áreas de influência: valor comer- cial, impactos da mudança cultural e implicações éticas. 24 IDENTIFICAR E COMUNICAR O VALOR COMERCIAL DOS DADOS A maioria dos executivos admite que suas organi- zações administram mal seus ativos de informação, levando a oportunidades de negócios perdidas e despesas indevidas. Os gestores de dados devem medir os principais atributos de qualidade das infor- mações, que incluem precisão, validade, usabilidade e sua relevância para os principais processos de ne- gócios. Ao mesmo tempo, eles precisam determinar o impacto real dos dados nos resultados de negó- cios para priorizar e melhor apoiar as iniciativas de gerenciamento de ativos de informações. Os gestores dos dados podem, então, mostrar para que são usados seus conjuntos de dados internos e externos, permitindo que os parceiros os auxiliem a identificar oportunidades de usar os dados existen- tes de maneiras mais inovadoras. ABORDAR OS IMPACTOS DA MUDANÇA CULTURAL DE UMA ABORDAGEM BASEADA EM DADOS Como parte do estabelecimento de uma cultura baseada em dados, os gestores de dados devem ser responsáveis pela mudança de cultura para apoiar a 25 transformação. Eles não podem simplesmente dizer às pessoas para mudarem sua cultura; eles devem inspirar as pessoas a acreditar que a mudança é necessária. Para abordar e influenciar a mudança de cultura, é necessário ser explícito sobre como os dados in- fluenciam os diferentes estilos de tomada de deci- são. Algumas decisões estratégicas são altamente incertas e reversíveis; outras são necessárias e irreversíveis. Comunicação ineficaz atrapalha a capacidade de desenvolver adesão, ganhar tração em seu papel e mudar o comportamento. Criar um plano de comu- nicação e influência identificando as partes interes- sadas e os tomadores de decisão é primordial para a implantação dessa cultura. GERENCIAR AS IMPLICAÇÕES ÉTICAS DE DADOS E ANÁLISES Estabelecer um código de conduta que defina as dire- trizes éticas para o uso de dados e análises. Equilibrar as oportunidades e limitações entre os benefícios dos dados e análises e os riscos éticos e de privacidade que eles representam. Finalmente, seja claro sobre quaisquer expectativas de comportamento. 26 REFERÊNCIAS BIBLIOGRÁFICAS Data-Driven: como promover uma cultura de ne- gócio orientada a dados. Disponível em: http:// materiais.treasy.com.br/data-driven-cm. Acesso em: 30 jan. 2021. OLIVEIRA, Marcus. Cultura data driven: enten- da como a Marvel e Netflix produzem conteúdos orientados a dados. Rockcontent Inteligência Corporativa, São Paulo, 4 maio 2018. Disponível em: https://inteligencia.rockcontent.com/marvel- netflix-data-driven/. Acesso em: 30 jan. 2021. GOASDUFF, Laurence. Create a data-driven cultu- re by influencing 3 areas. Smarter With Gartner, Stamford, 14 nov. 2019. Disponível em: https:// www.gartner.com/smarterwithgartner/create-a- data-driven-culture-by-influencing-3-areas/. Acesso em: 30 jan. 2021. 27 http://materiais.treasy.com.br/data-driven-cm http://materiais.treasy.com.br/data-driven-cm https://inteligencia.rockcontent.com/marvel-netflix-data-driven/ https://inteligencia.rockcontent.com/marvel-netflix-data-driven/ https://www.gartner.com/smarterwithgartner/create-a-data-driven-culture-by-influencing-3-areas/ https://www.gartner.com/smarterwithgartner/create-a-data-driven-culture-by-influencing-3-areas/ https://www.gartner.com/smarterwithgartner/create-a-data-driven-culture-by-influencing-3-areas/ AULA 4 BUSINESS INTELLIGENCE Empresas geram diariamente uma enorme quanti- dade de dados que podem conter padrões, relações, tendências e outras informações. No intuito de otimi- zar seu processo de decisão, as companhias cada vez mais buscam ferramentas que permitam transformar seus dados em informação e informação em decisão (BACH et al., 2016; YOON; GHOSH; JEONG, 2014). 29 Business Intelligence (BI) pode ser definido como um conjunto de métodos e sistemas utilizados para permitir a análise de informações históricas de uma empresa com o intuito de direcionar estra- tégias das companhias a fim de incrementar lucros (IŞIK et al., 2013). Para Grubljesic e Jaklic (2015), BI é a habilidade da empresa de atuar de maneira efetiva, explorando seus recursos humanos e de informações. Alguns autores associam o termo BI a métodos computa- cionais de processamento de dados que os transfor- mam em conhecimento e, posteriormente, em deci- sões para as instituições (POPOVIČ et al., 2012). De acordo com Turban, Sharda, Aronson e King (2009) as raízes do BI são provenientes da década de 1970, quando as empresas passaram a gerar relatórios, os chamados Sistemas de Informações Gerenciais (SIGs). Esses relatórios eram estáticos e bidimensionais e não possuíam recurso de aná- lise. Na década seguinte surgiram os Sistemas de Informações Executivas (SIEs), quando os relatórios passaram a ser dinâmicos e multidimensionais, com recursos de previsão, análise e tendências. Na dé- cada de 1990, o termo BI foi proposto pelo Gartner Group e dezenas de produtos comerciais surgiram, popularizando o conceito. Na década seguinte foram aperfeiçoadas as técnicas de análises, permitindo a utilização de um grande volume de dados (big data). 30 Para entender como o BI se aplica no cotidiano de uma empresa, Turban, Sharda, Aronson e King (2009) propuseram um modelo chamado Pressões – Reações – Suporte do negócio, conforme apresen- tado na Figura 1. FIGURA 1 – MODELO PRESSÕES – REAÇÕES – SUPORTE DO NEGÓCIO Globalização, demandas do consumidor, regulamentações governamentais, mercados e competição, etc. Pressões Fatores do ambiente de negócios Reações da organização Decisões e suporte Oportunidades Estratégia, colaboração dos parceiros, reação em tempo real, agilidade, maior produtividade, novos fornecedores, novos modelos de negóci, etc. Análise, decisões, previsões Suporte computadorizado à decisão integrado Business intelligence Fonte: Turban, Sharda, Aronson e King, 2009. Segundo os autores, a pressão advém da complexi- dade do ambiente em que as organizações operam. Se, por um lado, a complexidade traz oportunida- des, por outro, ela cria problemas. Tomando como exemplo a globalização,esta permite encontrar 31 clientes e fornecedores em vários países, trazendo mais opções para a empresa. Entretanto, a concor- rência fica maior e mais forte. Um agravante é que a intensidade desses fatores tende a aumentar com o tempo, gerando mais pressões. Nesse tipo de ambiente, os gestores devem tomar decisões rápidas e demonstrar inovação e agilidade. Os autores propõem algumas ações que podem ser adotadas para a “reação”, elencadas a seguir. ● Emprego de planejamento estratégico. ● Uso de modelos de negócios novos e inovadores. ● Reestruturação de processos de negócios. ● Participação em alianças de negócios. ● Aprimoramento dos sistemas de informações corporativos. ● Aprimoramento das relações de parceria. ● Incentivo à inovação e à criatividade. ● Aprimoramento do serviço de relacionamento com clientes. ● Adoção do comércio eletrônico. ● Adoção da manufatura sob encomenda e da produção e serviços sob demanda. 32 ● Uso de novas tecnologias de informação para melhorar a comunicação, o acesso aos dados e a colaboração. ● Rápida reação às ações dos concorrentes, como em precificação, promoções e novos produtos e serviços. ● Automatização de muitas tarefas do pessoal administrativo. ● Automatização de determinados processos de decisão, principalmente os que envolvem clientes. ● Aprimoramento da tomada de decisões. Uma análise das ações propostas revela que muitas delas, se não todas, necessitam de suporte compu- tadorizado. É nessa fase que entram os sistemas de BI, permitindo a consulta de informações em tempo real, criando análises ricas que permitam a con- dução das estratégias de negócio (Hou, 2016). Os usuários de sistemas de BI têm a possibillidade de tomar melhores decisões utilizando as informações certas (Han et al., 2016). Ziama e Kasher (2004) apontam alguns exemplos de perguntas que podem ser respondidas com o auxílio de BI, como consta no Quadro 1. 33 QUADRO 1 – VALOR PARA O NEGÓCIO DAS APLICAÇÕES ANALÍTICAS DE BI Aplicação analítica Pergunta de negócios Valor para o negócio Segmentação dos clientes Em quais segmentos de mercado meus clientes se encaixam e quais são suas características? Personalizar os relacionamentos com clientes para obter maior satisfação e retenção destes. Propensão à compra Quais clientes são mais propensos a responderem à minha promoção? Visar os clientes com base em suas necessidades de aumentar a fidelidade à sua linha de produtos. Aumentar também a lucratividade da promoção, enfocando quem tem mais possibilidades de comprar. Lucratividade dos clientes Qual é a lucratividade vitalícia de meu cliente? Tomar decisões individuais de interação de negócios com base na lucratividade geral dos clientes. 34 Aplicação analítica Pergunta de negócios Valor para o negócio Detecção de fraudes Como posso saber quais transações provavelmente serão fraudulentas? Determinar a fraude com rapidez e agir imediatamente para minimizar os custos. Perda de clientes Qual cliente está a ponto de sair? Evitar a perda de clientes de grande valor e abandonar os de menor valor. Otimização do canal Qual é o melhor canal para chegar ao meu cliente em cada segmento? Interagir com os clientes com base em suas preferências e em sua necessidade de gerenciar os custos. Fonte: Ziama e Kasher, 2004. Na primeira década do século XXI, o BI penetrou em vários segmentos da economia, tais como finanças, telecomunicações, seguros, bancos, manufatura e comércio (RAMAKRISHNAN et al., 2012). Muitas empresas desses segmentos conseguiram aumentar a lealdade de seus clientes e, consequentemente, au- mentar seus lucros. Segundo Turban, Sharda, Aronson e King (2009), as organizações passaram a obter mais valor do BI ao estender as informações existentes a muitos funcionários, maximizando o ativo de dados existentes. Ainda segundo esses autores, pesquisas e 35 projeções apontam que a tendência é que cada vez mais pessoas utilizem ferramentas de BI. REFERÊNCIAS BIBLIOGRÁFICAS BACH, M. P.; ČELJO, A.; ZOROJA, J. Technology ac- ceptance model for business intelligence systems: preliminary research. Procedia Computer Science, v. 100, p. 995-1001, 2016. Disponível em: https:// doi.org/10.1016/j.procs.2016.09.270. Acesso em: 9 mar. 2021. GRUBLJESIC, T.; JAKLIC, J. Conceptualization of the Business Intelligence Extended Use Model. Journal of Computer Information Systems, v. 55, n. 3, p. 72- 82, 2015. HAN, Y. M.; SHEN, C. S.; FARN, C. K. Determinants of continued usage of pervasive business intelli- gence systems. Information Development, v. 32, n. 3, p. 424-439, 2016. Disponível em: https://doi. org/10.1177/0266666914554811. Acesso em: 9 mar. 2021. HOU, C. Understanding business intelligen- ce system continuance intention : an em- pirical study of Taiwan’s electronics indus- try. Information Development, v. 32, n. 5, p. 36 https://doi.org/10.1177/0266666914554811 https://doi.org/10.1177/0266666914554811 1359-1371, 2016. Disponível em: https://doi. org/10.1177/0266666915599588. Acesso em: 9 mar. 2021. IŞIK, Ö.; JONES, M. C.; SIDOROVA, A. Business intelli- gence success: the roles of BI capabilities and deci- sion environments. Information and Management, v. 50, n. 1, p. 13-23, 2013. Disponível em: https:// doi.org/10.1016/j.im.2012.12.001. Acesso em: 9 mar. 2021. POPOVIČ, A.; HACKNEY, R.; COELHO, P. S.; JAKLIČ, J. Towards business intelligence systems success: effects of maturity and culture on analytical deci- sion making. Decision Support Systems, v. 54, n. 1, p. 729-739, 2012. Disponível em: https://doi. org/10.1016/j.dss.2012.08.017. Acesso em: 9 mar. 2021. RAMAKRISHNAN, T.; JONES, M. C.; SIDOROVA, A. Factors influencing business intelligence (BI) data collection strategies: an empirical investigation. Decision Support Systems, v. 52, n. 2, p. 486–496, 2012. Disponível em: https://doi.org/10.1016/j. dss.2011.10.009. Acesso em: 9 mar. 2021. TURBAN, E.; SHARDA, R.; ARONSON, J. E.; KING, D. Business Intelligence: um enfoque gerencial para a inteligência do negócio. São Paulo: Bookman, 2009. 37 https://doi.org/10.1177/0266666915599588 https://doi.org/10.1177/0266666915599588 https://doi.org/10.1016/j.im.2012.12.001 https://doi.org/10.1016/j.im.2012.12.001 https://doi.org/10.1016/j.dss.2012.08.017 https://doi.org/10.1016/j.dss.2012.08.017 https://doi.org/10.1016/j.dss.2011.10.009 https://doi.org/10.1016/j.dss.2011.10.009 YOON, T. E.; GHOSH, B.; JEONG, B. (2014). User acceptance of Business Intelligence (BI) applica- tion: technology, individual difference, social in- fluence, and situational constraints. 47th Hawaii International Conference on System Sciences (HICSS), Institute of Electrical and Electronics Engineers, Waikoloa, 6 a 9 jan. 2014. Disponível em: https://doi.org/10.1109/HICSS.2014.467. Acesso em: 9 mar. 2021. ZIAMA, A.; KASHER, J. Data mining primer for the data warehouse professional. Dayton: Teradata, 2004. 38 https://doi.org/10.1109/HICSS.2014.467 AULA 5 BUSINESS ANALYTICS Dentro do conceito de BI, há o conceito de analytics (PAYANDEH, 2013), também chamado de Business Analytics (BA), que se refere ao foco mais estatís- tico da apreciação dos dados, segundo Davenport (2006), representando o componente analítico chave de BI. 40 As oportunidades associadas a dados e análises em diferentes organizações ajudaram a gerar interesse significativo em Business Analytics, que muitas ve- zes é referido como técnicas, tecnologias, sistemas, práticas, metodologias e aplicativos que analisam dados críticos de negócios para ajudar uma empre- sa a entender melhor suas atividades e mercado de atuação e tomar decisões oportunas. Além do pro- cessamento de dados subjacente e das tecnologias analíticas, a Business Analytics inclui práticas e me- todologias centradas nos negócios que podem ser empregadas em diversas aplicações de alto impacto, como e-commerce e inteligênciade mercado. A primeira onda de análises – que aborda a pergun- ta “Por que aconteceu?” – é dedutiva por natureza, enquanto a segunda onda de análises — que aborda a questão “O que vai acontecer?” – é principalmen- te indutiva. ● Com análises dedutivas, os usuários de negócios usam ferramentas como Excel, OLAP e ferramentas de análise visual para explorar uma hipótese. Eles tomam uma premissa sobre qual é a causa raiz de alguma anomalia ou alerta de desempenho e, em seguida, usam ferramentas analíticas para explorar os dados e verificar ou negar a hipótese. Se a hipó- tese se provar falsa, eles levantam uma nova hipó- tese e começam a olhar em outra direção. 41 ● Análise indutiva é o oposto. Os usuários de ne- gócios não começam com uma hipótese, eles co- meçam com um resultado ou meta do negócio (por exemplo, “encontrar os 10% mais rentáveis de nos- sos clientes e perspectivas que são mais propensas a responder a essa oferta”) e, em seguida, coletar da- dos históricos que os ajudarão a discernir a resposta. Eles, então, usam as análises para criar modelos es- tatísticos ou de aprendizado de máquina dos dados para responder à sua pergunta. Em outras palavras, eles não começam com uma hipótese, eles começam com os dados e deixam as ferramentas analíticas descobrir os padrões e anomalias para eles. Mas que tipo de perguntas pertencem às análises avançadas? Existem quatro categorias principais, detalhadas a seguir. 1. Analise o passado. Embora usemos principal- mente ferramentas dedutivas para examinar ten- dências passadas, ferramentas analíticas modelam o passado. Algumas perguntas aparentemente fáceis podem ser mais difíceis de responder porque en- volvem a interação de muitas variáveis. Estas in- cluem: “Por que as vendas tiveram queda no último trimestre?”. 2. Otimize o presente. Uma vez que modelamos a atividade passada e entendemos as relações entre as principais variáveis, podemos aproveitar essas 42 informações para otimizar os processos atuais. Por exemplo, um modelo de cesta de compras pode ajudar os varejistas a projetar layouts de lojas para maximizar os lucros. 3. Prever o futuro. Aplicando o modelo (ou seja, a equação matemática) a cada novo registro, pode- mos adivinhar com um grau razoável de precisão se um cliente pode responder positivamente a uma promoção ou se uma transação é fraudulenta. 4. Testar suposições. Análises avançadas também podem ser usadas para testar suposições sobre o ne- gócio. Por exemplo, antes de gastar milhões em uma campanha de marketing, um varejista pode testar uma suposição de que os clientes localizados a uma distância de um quilometro quadrada de grandes concorrentes são menos fiéis do que outros. Chen et al. (2012) cunharam o termo Business Intelligence e Analytics (BI&A) e apontam que sua popularidade, relacionada ao conceito de big data, aumentou tanto no campo acadêmico quanto nas empresas ao longo das duas primeiras décadas do século XXI. Esses mesmos autores defendem que se está entrando na terceira geração de BI&A. Eles de- finem as três fases como BI&A 1.0, BI&A 2.0 e BI&A 3.0. É importante ressaltar que essas quatro fases não são excludentes, ou seja, elas podem coexistir dentro de uma empresa. 43 BUSINESS INTELLIGENCE E ANALYTICS 1.0 (BI&A 1.0) É a mais largamente utilizada no mercado, trabalha com dados estruturados provenientes de sistemas legados das empresas. Foi popularizado na década de 1990 e utiliza principalmente técnicas estatísticas desenvolvidas nos anos 1970 e métodos de minera- ção de dados da década de 1980. O armazenamento e o gerenciamento das bases de dados são a sustentação do BI&A 1.0. O desenvolvi- mento de ferramentas de extração, transformação e carga dos dados, conhecido como ETL (Extraction, Transformation and Load), é essencial para a in- tegração dos dados. Gráficos são utilizados para explorar as características da base de dados, e rela- tórios e dashboards auxiliam no monitoramento do negócio; adicionalmente, técnicas estatísticas e de mineração de dados são utilizadas para segmenta- ção, análise de regressão, análise de conglomerados e detecção de anomalias. BUSINESS INTELLIGENCE E ANALYTICS 2.0 (BI&A 2.0) No começo dos anos 2000, a popularização da inter- net trouxe novas fontes de dados que permitiram 44 novas oportunidades de negócio. Sítios de busca, como Yahoo e Google, ou de comércio eletrônico, como Amazon ou Ebay, permitem a apresentação on-line com os clientes e a interação é direta. Essa nova realidade descobriu uma nova “mina de ouro” no entendimento das necessidades dos clientes e na exploração de novas formas de negócio. A era do BI&A 2.0 está centrada em análise de texto e análise de conteúdos não estruturados da web. A análise do comportamento de “cliques” do cliente revela seu perfil e comportamento de compra. A ex- pansão das redes sociais, a partir de 2004, permitiu uma compreensão maior do indivíduo por meio da análise dos fóruns, blogs, grupos, sítios e multimídia (fotos e vídeos). BUSINESS INTELLIGENCE E ANALYTICS 3.0 (BI&A 3.0) Enquanto a era do BI&A 2.0 atrai muitos pesquisa- dores da academia e da indústria, o BI&A 3.0 vem emergindo na década de 2010. Essa nova era é baseada em dispositivos pessoais acessando a inter- net, como tablets e smartphones. Esses dispositivos centralizam o acesso à internet e o fazem em tempo real. De acordo com Chen et al. (2012), o número de dispositivos pessoais com acesso à internet supe- 45 rou o número de computadores pessoais e laptops pela primeira vez em 2011. A estimativa é que esses dispositivos cheguem a 10 bilhões em 2020. Além disso, outros dispositivos pessoais, como relógios, GPS, sensores e códigos de barra podem transmitir dados. QUADRO 2 – AS TRÊS ERAS DO BI&A BI&A 1.0 BI&A 2.0 BI&A 3.0 Informações internas das empresas estruturadas e controladas. Conteúdo baseado em informações não estruturadas da web. Conteúdo baseado em dispositivos móveis e sensores. Fonte: Chen et al.,2012. REFERÊNCIAS BIBLIOGRÁFICAS CHEN, H.; CHIANG, R. H. L.; STOREY, V. C. Business Intelligence and Analytics: from big data to big im- pact. MIS Quarterly, v. 36, n. 4, p. 1165-1188, 2012. DAVENPORT, T. H. Competing on analytics. Harvard Business Review, v. 84, p. 98-107, 2006. Disponível 46 em: https://hbr.org/2006/01/competing-on- analytics. Acesso em: 30 mar. 2021. PAYANDEH, F. BI vs. big data vs. data analytics by example. Data Science Central, [s. l.], 25 ago. 2013. Disponível em: http://www.datasciencecentral. com/profiles/blogs/bi-vs-big-data-vs-data-analytics- by-example. Acesso em: 15 mar. 2021. 47 https://hbr.org/2006/01/competing-on-analytics https://hbr.org/2006/01/competing-on-analytics http://www.datasciencecentral.com/profiles/blogs/bi-vs-big-data-vs-data-analytics-by-example http://www.datasciencecentral.com/profiles/blogs/bi-vs-big-data-vs-data-analytics-by-example http://www.datasciencecentral.com/profiles/blogs/bi-vs-big-data-vs-data-analytics-by-example AULA 6 BIG DATA A evolução dos computadores, principalmente a partir da década de 1970, permitiu o aumento da velocidade de processamento e maior capacidade de armazenamento de dados (HAMANN, 2016). 49 Além disso, a proliferação da internet cria vasta informação nova de forma muito veloz. Segundo Zikopoulos et al. (2012), no começo da década de 2010, o Twitter gerava 7 terabytes (Tb) diários de informação, enquanto o Facebook, por volta de 10 Tb. Na mesma linha, Manyika et al. (2011) afirmam que, 15 de 17 setores da economia norte-americana possuíam, em 2010, mais informação armazenada do que a Biblioteca do Congresso norte-americano. Big data pode ser definido como uma informação que é muito grande, muito veloz ou muito difícil de ser processada com as ferramentas existentes (MADDEN, 2012). O conceito de grande refere-se ao crescente volume de dados armazenados; ve- loz significa que os dados, além de serem grandes, devem ser processadosde forma rápida, e é quando a dificuldade aparece, pois a dificuldade é apresen- tada, pois muitas vezes os dados não são estrutu- rados. Na mesma linha, Laney (2001) foi o pioneiro em defender que o big data, que tem três caracte- rísticas principais, o chamado modelo dos três Vs: volume, velocidade e variedade. Na questão de volume, Wilder-James (2012) de- fine que o principal ganho proporcionado pelo conceito big data é trazer mais dados para a análise, permitindo a construção de modelos analíticos melhores. Por outro lado, muitos 50 dados representam um grande desafio para as áreas de tecnologia da informação em termos de armazenamento, integração e disponibilidade (VITOLO et al., 2015). Muitas empresas conse- guem guardar um grande volume de dados, porém, não são capazes de processá-los (WILDER-JAMES, 2012). A importância da velocidade pode ser observa- da, por exemplo, num processo de compra on-line (WILDER-JAMES, 2012): antes mesmo de um pe- dido ser fechado o portal de compras já consegue avaliar sua solicitação e sugerir produtos ao com- prador. Velocidade implica quão rapidamente as in- formações são coletadas, armazenadas e utilizadas na tomada de decisão (ZIKOPOULOS et al., 2012). Essa grande quantidade de dados vem de diferen- tes fontes, com periodicidades diversas e formatos distintos (LANEY, 2001). O desafio nessa variedade é fazer a integração de forma a convergirem todos os dados. Raramente os dados recebidos de fontes diversas apresentam a mesma estrutura, ordenados e prontos para serem processados, fato que resulta em situações complicadas (WILDER-JAMES, 2012; WU et al., 2014), que é onde reside boa parte das dificuldades de implantação de um big data numa empresa. 51 As características do big data podem ser resumidas no acrônimo HACE, sugerido por Wu et al. (2014), pois, de acordo com os autores, o big data se inicia com um grande volume Heterogêneo de dados, de fontes Autônomas distribuídas e descentralizadas, Complexas e Envolvendo relações entre elas. Essas características tornam extremamente desafiador ex- trair conhecimento útil dos dados. Os autores fazem uma analogia com um grupo de cegos tentando iden- tificar um elefante, conforme apontado na Figura 2. FIGURA 2 – CEGOS E O ELEFANTE, A VISÃO PARCIAL DE CADA CEGO LEVA A CONCLUSÕES ENVIESADAS Fonte: Wu, Zhu, Wu e Ding, 2014. 52 Da mesma forma que é difícil para os cegos “enxer- garem” o elefante, no big data, é complexo anali- sar todos os dados e uma visão parcial pode trazer conclusões errôneas. Para tornar o problema ainda mais complicado, o “elefante” cresce constantemen- te e se modifica, e cada “cego” tira suas próprias conclusões. A chave para solucionar esse problema é unir a informação dos vários “cegos” para fazer o melhor desenho possível do elefante. Esse cenário traz oportunidades para as empresas. Conforme Brown, Chui e Manyika (2011), estudos apontam que companhias que utilizam bases de da- dos e ferramentas analíticas na tomada de decisão apresentam melhores resultados do que compa- nhias que não as utilizam. As mudanças na empresa se dão na transformação dos processos, alteração do ecossistema interno e maiores oportunidades de inovação. Na visão de Biesdorf, Court e Willmott (2013), o planejamento para introdução do concei- to de big data em uma empresa deve abordar três vertentes principais descritas na sequência. 1. DADOS: o plano deve prever como coletar e integrar dados de diversas fontes bem como arma- zenar histórico para análises futuras. 2. MODELOS ANALÍTICOS: os dados sozinhos não geram valor. Os modelos analíticos ajudam a enten- der o contexto dos dados, desenhar cenários e fazer previsões. 53 3. FERRAMENTAS: neste passo é importante fazer com que os resultados obtidos nos modelos analíti- cos sejam incorporados no dia a dia da organização. Segundo os autores, essa é uma falha muito comum nas empresas – não conseguir fazer com que os ges- tores e os funcionários compreendam os resultados da análise e atuem de maneira rápida e eficiente. Manyika et al. (2011) realizaram uma pesquisa com diversas indústrias nos mercados europeu e norte- -americano e chegaram a sete conclusões principais. I. Big data está em todos os setores da Economia e é parte importante da cadeia de produção para as empresas. II. Big data cria valor de diversas formas. Os auto- res citam como exemplo: aumentar a transparência, visto que os dados são acessíveis aos stakeholders; automatizar decisões; permitir inovações em produ- tos e serviços, entre outros. III. A utilização do big data se tornou a chave da competitividade e crescimento para as empresas. IV. Permite aumentar as margens das empresas e a satisfação dos clientes. V. Ainda que a adoção do big data seja importante para todos os setores, alguns são mais propícios a ter ganhos maiores. 54 VI. É necessário um bom conhecimento estatístico- analítico para extrair mais vantagens. VII. As empresas buscam aumentar suas fontes de informação para alimentar o big data. Conforme mencionado anteriormente, nesse cená- rio de big data, a análise passa a ter um papel muito importante. Por essa razão, o conceito de Business Intelligence e Analytics vem ganhando destaque no século XXI (WU et al., 2014). REFERÊNCIAS BIBLIOGRÁFICAS BIESDORF, S.; COURT, D.; WILLMOTT, P. Big data: what’s your plan? McKinsey Quarterly, [s. l.], 1 mar. 2013. Disponível em: https://www.mckinsey.com/ business-functions/mckinsey-digital/our-insights/ big-data-whats-your-plan. Acesso em: 15 mar. 2021. BROWN, B.; CHUI, M.; MANYIKA, J. Are you rea- dy for the era of ‘big data’? McKinsey Quarterly, out., p. 1-12, 2011. Disponível em: https://www. mckinsey.com/business-functions/strategy-and- corporate-finance/our-insights/are-you-ready-for- the-era-of-big-data. Acesso em: 15 mar. 2021. HAMANN, R. Das toneladas aos microchips: a evo- 55 https://www.mckinsey.com/business-functions/mckinsey-digital/our-insights/big-data-whats-your-plan https://www.mckinsey.com/business-functions/mckinsey-digital/our-insights/big-data-whats-your-plan https://www.mckinsey.com/business-functions/mckinsey-digital/our-insights/big-data-whats-your-plan https://www.mckinsey.com/business-functions/strategy-and-corporate-finance/our-insights/are-you-ready-for-the-era-of-big-data https://www.mckinsey.com/business-functions/strategy-and-corporate-finance/our-insights/are-you-ready-for-the-era-of-big-data https://www.mckinsey.com/business-functions/strategy-and-corporate-finance/our-insights/are-you-ready-for-the-era-of-big-data https://www.mckinsey.com/business-functions/strategy-and-corporate-finance/our-insights/are-you-ready-for-the-era-of-big-data lução dos computadores. Tecmundo, [s. l.], 3 jun. 2016. Disponível em: http://www.tecmundo.com. br/infografico/9421-a-evolucao-dos-computadores. htm. Acesso em: 15 mar. 2021. LANEY, D. 3-D data management: controlling data volume, velocity and variety. META Group Research Note, (S.l), 2001. MADDEN, S. From databases to big data. IEEE Internet Computing, v. 16, n. 3, p. 4-6, maio- -jun.2012. Disponível em: https://doi.org/10.1109/ MIC.2012.50. Acesso em: 15 mar. 2021. MANYIKA, J.; CHUI, M.; BROWN, B.; BUGHIN, J.; DOBBS, R.; ROXBURGH, C.; BYERS, A. H. Big data: the next frontier for innovation, competition, and productivity. McKinsey Global Institute, [s. l.], 2011. Disponível em: https://www.mckinsey.com/ business-functions/mckinsey-digital/our-insights/ big-data-the-next-frontier-for-innovation. Acesso em: 15 mar. 2021. VITOLO, C.; ELKHATIB, Y.; REUSSER, D.; MACLEOD, C. J. A.; BUYTAERT, W. (2015). Web technologies for environmental big data. Environmental Modelling & Software, v. 63, p. 185-198, 2015. Disponível em: https://doi.org/10.1016/j.envsoft.2014.10.007. Acesso em: 15 mar. 2021. 56 http://www.tecmundo.com.br/infografico/9421-a-evolucao-dos-computadores.htm http://www.tecmundo.com.br/infografico/9421-a-evolucao-dos-computadores.htm http://www.tecmundo.com.br/infografico/9421-a-evolucao-dos-computadores.htmhttps://doi.org/10.1109/MIC.2012.50 https://doi.org/10.1109/MIC.2012.50 https://www.mckinsey.com/business-functions/mckinsey-digital/our-insights/big-data-the-next-frontier-for-innovation https://www.mckinsey.com/business-functions/mckinsey-digital/our-insights/big-data-the-next-frontier-for-innovation https://www.mckinsey.com/business-functions/mckinsey-digital/our-insights/big-data-the-next-frontier-for-innovation https://doi.org/10.1016/j.envsoft.2014.10.007 WILDER-JAMES, E. (2012). What is big data? An introduction to the big data landscape. O’Reilly, Sebastopol, 11 jan. 2012. Disponível em: https:// www.oreilly.com/ideas/what-is-big-data. Acesso em: 15 mar. 2021. WU, X.; ZHU, X.; WU, G.-Q.; DING, W. Data mining with big data. IEEE Transactions on Knowledge and Data Engineering, v. 26, n. 1, p. 97107, 2014. Disponível em: https://doi.org/10.1109/ TKDE.2013.109. Acesso em: 15 mar. 2021. ZIKOPOULOS, P.; EATON, C.; DEROOS, D.; LAPIS, G.; DEUTSCH, T. Understanding big data. Nova York: McGraw-Hill, 2012. 57 https://www.oreilly.com/ideas/what-is-big-data https://www.oreilly.com/ideas/what-is-big-data https://doi.org/10.1109/TKDE.2013.109 https://doi.org/10.1109/TKDE.2013.109 AULA 7 DATA MINING I Data mining ou mineração de dados é uma arte. Envolve a aplicação de uma quantidade substancial de ciência e tecnologia, mas o uso adequado ainda envolve arte. Como acontece com os projetos de artesanato, existe um processo bem compreendido que estrutura o problema, permitindo consistência razoável, repetibilidade e objetividade. 59 Uma representação útil do ciclo de vida da minera- ção de dados foi feito pelo CRoss Industry Standard Process for Data Mining (CRISP-DM), composta por seis passos, conforme representado na Figura 3. FIGURA 3 – PASSOS DA MINERAÇÃO DE DADOS Implantação Compreensão do negócio Compreensão dos dados Preparação dos dados Modelagem Avaliação Dados Fonte: Fawcett e Provost (2018) Os seis passos são: compreensão do negócio, com- preensão dos dados, preparação dos dados, mode- lagem, avaliação e implantação. 60 COMPREENSÃO DO NEGÓCIO Inicialmente, é fundamental entender o problema a ser resolvido. Muitas vezes, reformular o problema e projetar uma solução é um processo iterativo de descoberta. O estágio de compreensão do negócio representa uma parte do ofício em que a criativida- de desempenha um grande papel. Isso pode signifi- car estruturar o dilema como se ele fosse composto por um ou mais subproblemas que envolvem a construção de modelos para classificação, regres- são, estimativa de probabilidade e assim por diante. Ao discutir isso com mais detalhes, começamos com uma visão simplificada do cenário, mas, à medida que avançamos, vamos voltar e perceber que mui- tas vezes o cenário de uso deve ser ajustado para refletir melhor a necessidade real do negócio. COMPREENSÃO DOS DADOS Se resolver o problema do negócio é o objetivo, os dados constituem a matéria-prima disponível a partir da qual a solução será construída. É importante com- preender os pontos fortes e as limitações dos dados porque raramente os dados se encaixam perfeita- mente ao seu problema. Também é muito importan- te guardar o histórico de dados, mesmo que os dados 61 coletados não relacionados estejam sendo utilizados para o problema de negócios atual, pois podem ser utilizados em análises futuras e/ou complementares. Também é comum que os custos dos dados variem. Alguns dados estarão disponíveis gratuitamente, enquanto outros exigirão esforço para sua obtenção. Outros, ainda, simplesmente não existirão e exigirão projetos auxiliares inteiros para organizar sua coleta. Uma parte crítica da fase de compreensão dos dados é estimar os custos e os benefícios de cada fonte de dados e decidir se mais investimentos são necessários. PREPARAÇÃO DOS DADOS A fase de preparação de dados consiste na limpeza, transformação, integração e formatação dos dados da etapa anterior. É a atividade pela qual os ruídos, dados estranhos ou inconsistentes são tratados. Esta fase abrange todas as atividades para construir o conjunto de dados final (dados que serão alimen- tados nas ferramentas de mineração) a partir do conjunto de dados inicial. A utilização de data warehouses facilita em muito esta etapa do processo de mineração de dados. Por essa razão, é muito importante para uma organi- zação que ela possua em seus processos habituais boas práticas da administração de dados. 62 MODELAGEM O estágio de modelagem é o principal. É nele que as técnicas de mineração de dados são aplicadas para os dados. É importante ter alguma compreensão das ideias fundamentais de mineração, incluindo os tipos de técnicas e algoritmos que existem, porque esta é a parte do ofício em que a maior parte da ciência e tecnologia pode ser aplicada. AVALIAÇÃO O objetivo da fase de avaliação é analisar os resul- tados da mineração de dados de forma rigorosa para garantir que são válidos e confiáveis antes de prosseguir. Se olharmos bem o suficiente, em qual- quer conjunto de dados, encontraremos padrões, mas eles podem não sobreviver a um exame mais cuidadoso. É crucial termos confiança de que os modelos e padrões extraídos dos dados são verdadeiras regu- laridades e não apenas casuísmos ou anomalias de amostra. Os resultados devem ser replicáveis. Antes da implantação, deve-se testar um modelo em um ambiente de laboratório controlado. Outro ponto importante desta fase é garantir que o modelo satis- faça os objetivos de negócios originais. 63 Lembre-se de que o propósito fundamental da ciência de dados para negócios é apoiar a toma- da de decisão e que iniciamos o processo com foco no problema que gostaríamos de resolver. Normalmente, uma solução de mineração de dados é apenas uma parte da resolução maior e precisa ser avaliada como tal. Note que resultados aqui po- dem afetar a fase de compreensão do negócio. IMPLANTAÇÃO Na implantação, os resultados da mineração de dados são colocados em uso real para obter o retorno sobre o investimento. Os casos mais comuns de implanta- ção envolvem a execução de um modelo preditivo em sistemas de informação ou processo de negócios. Por exemplo, um modelo para prever a probabilidade de churn pode ser integrada com o processo de negócios para gerenciamento de churn, por exemplo, enviando ofertas especiais para clientes que estão particular- mente em risco de deixar a empresa. Outro exemplo é um modelo de detecção de fraude que pode ser construído para monitorar contas e criar “casos” para analistas de fraude examinarem. REFERÊNCIA BIBLIOGRÁFICA FAWCETT, T.; PROVOST, F. Data science para negócios: o que você precisa saber sobre mineração de dados e pensamento analítico de dados. Rio de Janeiro: Alta Books, 2018. 64 AULA 8 DATA MINING II Existem muitos algoritmos de mineração de dados específicos desenvolvidos ao longo dos anos que podem ser agrupados de acordo com os tipos de tarefas a que esses algoritmos atendem. 66 CLASSIFICAÇÃO E A ESTIMATIVA DE PROBABILIDADE A classificação e a estimativa de probabilidade tentam prever, para cada indivíduo em uma popu- lação, a qual, de um (pequeno) conjunto de classes, esse indivíduo pertence. Usualmente as classes são mutuamente exclusivas. Um exemplo de pergunta de classificação seria: “Entre todos os meus clientes, quais provavelmente aceitarão uma determinada oferta?”. Neste exemplo, as duas classes seriam: aceitarão e não aceitarão. Para uma tarefa de classificação, um procedimen- to de mineração de dados produz um modelo que, dado um novo indivíduo, determina a qual classe esse indivíduo pertence. Intimamente relaciona- da a essa tarefa está a pontuação ou estimativa de probabilidade de classe. Um modelo de pontuação aplicado a um indivíduo produz, em vez de uma previsão de classe, uma pontuação que representa a probabilidade (ou alguma outra quantificação de probabilidade) de que esse indivíduo pertença a cada classe.67 REGRESSÃO (“ESTIMATIVA DE VALOR”) A regressão tenta estimar ou prever, para cada indivíduo, o valor numérico de alguma variável para aquele indivíduo. Um exemplo de regressão está na pergunta: “Quantas vezes um determinado cliente usará um serviço?”. A propriedade (variável) a ser prevista aqui é o uso do serviço, e um modelo po- deria ser gerado para encontrar outros indivíduos semelhantes na população e seus históricos de uso. Um procedimento de regressão produz um modelo que, dado um indivíduo, estima o valor da variável particular específica para aquele indivíduo. A re- gressão está relacionada à classificação, mas os dois são diferentes. Informalmente, a classificação prevê se algo vai acontecer, enquanto a regressão prevê “o quanto” vai acontecer. COMBINAÇÃO POR SIMILARIDADE A combinação por similaridade é utilizada para iden- tificar indivíduos semelhantes com base em dados conhecidos sobre eles. A correspondência por simi- laridade pode ser usada diretamente para localizar entidades semelhantes. 68 Por exemplo, a IBM está interessada em encontrar empresas semelhantes aos seus melhores clien- tes empresariais a fim de concentrar sua força de vendas nas melhores oportunidades. Para isso, eles usam a similaridade, correspondência basea- da em dados que descrevem as características das empresas. A correspondência por similaridade é a base para um dos métodos mais populares para fazer reco- mendações de produtos (encontrar pessoas que são semelhantes a você em termos dos produtos de que gostaram ou compraram). Medidas de similaridade fundamentam certas soluções para outras tarefas de mineração de dados, como classificação, regres- são e agrupamento. AGRUPAMENTO O agrupamento tenta agregar indivíduos em uma população por sua semelhança, mas não dirigido por nenhum propósito específico. Um exemplo de questão de agrupamento seria: “Nossos clientes formam grupos ou segmentos naturais?”. O agrupamento é útil na fase preliminar de explora- ção de domínio para verificar quais grupos naturais existem, porque esses grupos, por sua vez, podem 69 sugerir outras tarefas ou abordagens de mineração de dados. Também é usado como entrada para pro- cessos de tomada de decisão com foco em questões como: “Quais produtos devemos oferecer ou de- senvolver?”, “Como devem ser estruturadas nossas equipes de atendimento ao cliente (ou equipes de vendas)?”. AGRUPAMENTO DE CO-OCORRÊNCIA O agrupamento de co-ocorrência também é conhe- cido como mineração de conjunto de itens frequen- tes ou regra de associação e análise de cesta de compras. Esse recurso tenta encontrar associações entre entidades com base nas transações que os envolvem. Um exemplo de pergunta de co-ocorrên- cia seria: “Quais itens são comumente comprados juntos?”. Enquanto o agrupamento olha para a similaridade entre objetos com base em seus atributos, o agru- pamento de co-ocorrência considera a similaridade de objetos com base em sua ocorrência conjunta nas transações. Por exemplo, ao analisar os re- gistros de compra de um supermercado, pode-se descobrir que carne moída é comprada junto com molho picante com muito mais frequência do que nós poderíamos supor. Decidir como agir sobre essa 70 descoberta pode exigir alguma criatividade, mas pode sugerir uma promoção especial, exibição de produto ou combinação de oferta. A co-ocorrên- cia de produtos nas compras é um tipo comum de agrupamento. DESCRIÇÃO DE COMPORTAMENTO A criação de perfil (também conhecida como des- crição de comportamento) tenta caracterizar o comportamento típico de um indivíduo, grupo ou população. Um exemplo de pergunta de perfil se- ria: “Qual é o uso típico do aparelho celular neste segmento de clientes?”. Comportamento pode não ter uma descrição simples; o perfil de uso do celular pode exigir uma complexa descrição das médias de tempo em período noturno e fins de semana, uso internacional, uso de banda larga, minutos de liga- ção, envio de SMS e assim por diante. O comportamento pode ser descrito para uma po- pulação inteira ou para pequenos grupos ou mesmo indivíduos. A criação de perfil é frequentemente usada para estabelecer normas comportamentais para aplicativos de detecção de anomalias, como detecção de fraudes e monitoramento de intrusões em sistemas de computador. 71 Por exemplo, se sabemos que tipo de compras uma pessoa normalmente faz com um cartão de crédito, podemos determinar se uma nova cobrança no car- tão se encaixa nesse perfil ou não. Podemos usar o grau de incompatibilidade como uma pontuação de suspeita e emitir um alerta se o grau for muito alto. PREVISÃO DE VÍNCULO A previsão de vínculo tenta prever ligações entre itens de dados, geralmente sugerindo que deve existir um vínculo entre eles e, possivelmente, tam- bém estimando sua força. Este recurso é muito co- mum em redes sociais: “Uma vez que você e Karen possuem 10 amigos em comum, você gostaria de ser amigo de Karen?”. Outro exemplo de sua utilização é na recomendação de filmes que a Netflix faz ou as sugestões de compras que você recebe por ter feito compras anteriores. Os vínculos constituem a base das recomendações. REDUÇÃO DE DADOS A redução de dados tenta, a partir de um grande conjunto de dados, substituí-lo por um conjunto menor de dados, que contém muitas informações 72 importantes do conjunto maior. O conjunto de da- dos menor pode ser mais fácil de lidar ou processar. Além disso, quanto menor o conjunto de dados, melhor ele pode revelar informações. A redução de dados geralmente envolve perda de informações, por isso é importante haver um equilí- brio para melhor compreensão dos dados. MODELAGEM CAUSAL A modelagem causal tenta nos ajudar a entender quais eventos ou ações realmente influenciam ou- tros indivíduos. Por exemplo, considere que usamos modelagem preditiva para direcionar anúncios aos consumidores e observamos que, de fato, os con- sumidores-alvo compraram mais após terem sido alvos. Isso aconteceu porque os anúncios influen- ciaram os consumidores a comprar? Ou os modelos preditivos simplesmente fizeram um bom trabalho identificando os consumidores que teriam compra- do de qualquer maneira? As técnicas de modelagem causal incluem aquelas que envolvem um investi- mento substancial em dados, como experimentos controlados randomizados (por exemplo, os chama- dos “A / B testes”), bem como métodos sofisticados para tirar conclusões causais de dados. 73 REFERÊNCIA BIBLIOGRÁFICA FAWCETT, T.; PROVOST, F. Data science para negócios: o que você precisa saber sobre mineração de dados e pensamento analítico de dados. Rio de Janeiro: Alta Books, 2018. 74 AULA 9 PROBLEM SOLVING Na tradução para o português, problem solving significa encontrar soluções para problemas. No mundo corporativo, tratamos problem solving como uma metodologia de melhoria contínua. Trata-se de uma análise estratégica da situação para que, assim, possam ser tomadas as melhores decisões para a resolução de algum problema. 76 O processo de problem solving consiste em uma aplicação sistemática para que seja possível enten- der o tipo de impacto que determinada situação implica e, assim, chegar até as raízes desse proble- ma, pois o objetivo é atuar precisamente nos focos causadores de problemas. Um problema ocorre quando um solucionador de problemas tem uma meta, mas, inicialmente, não sabe como alcançá-la. Essa definição tem três partes: 1. o estado atual – o problema começa em um determinado estado; 2. o estado de objetivo – o solucionador de pro- blemas deseja que o problema esteja em um estado diferente, e a resolução de problemas é necessária para transformar o problema do estado atual (ou dado) para o estado de objetivo; 3. obstáculos – o solucionador não sabe a reso- lução correta e um método de solução eficaz não é óbvio para ele. Existem algumas metodologias e ferramentas uti- lizadas para que seja possível chegar ao problema. Cada uma possui suaparticularidade, mas todas têm algo em comum: uma abordagem flexível que pode ser implementada em diferentes contextos e adaptada conforme as necessidades das empresas. 77 A seguir, são apresentadas as metodologias utili- zadas por três consultorias estratégicas, McKinsey, Bain&Company e BCG. METODOLOGIA MCKINSEY A metodologia da McKinsey é formada por sete pas- sos e foca na comunicação entre os componentes da equipe e entre a equipe e o cliente, buscando, a cada passo, buscar respostas. Trata-se de uma abor- dagem flexível, adaptável aos mais diferentes con- textos. Os sete passos são: 1. Definir o problema Pensar no impacto: “O que preciso saber e como enquadrar o problema?”. Pensar na próxima etapa da iteração: “Quais são as próximas prioridades da equipe?”. 2. Estruturar o problema Pensar em fragmentação e na primeira hipótese: “Quais são os elementos-chave do problema?”, “Eles fornecem indícios iniciais sobre a resposta?”. 78 3. Priorizar questões Pensar em impacto e eficiência: “Em que partes é mais importante focar?”. 4. Planejar análises e trabalho Pensar em eficácia: “Como os recursos podem ser utilizados da melhor forma?”. 5. Conduzir análises Pensar em termos de “respostas”: “Qual é a abor- dagem mais simples, baseada em fatos, que provará ou refutará cada questão?”. 6. Sintetizar resultados Pensar “e agora?”: “Como utilizar as descobertas para contar uma história convincente?”. 7. Desenvolver recomendações Pensar em ações possíveis: “Está claro o que o clien- te precisa fazer e como fazer?”. 79 METODOLOGIA BAIN & COMPANY A Bain & Company, por sua vez, tem uma metodo- logia que se divide, a princípio, em quatro passos, sendo também ajustável e aplicável a quase qual- quer problema de negócio. Este método também contém passos de definição do trabalho e análises. Para a Bain, a principal eta- pa é a primeira. A chamada Answer First (Reponda Primeiro) consiste em, basicamente, criar respostas para a pergunta inicial. Daí em diante, o esforço é para provar essas respostas. 1. Responda primeiro Apesar de as respostas mudarem ao longo do pro- jeto, este passo facilita o trabalho. Segundo a con- sultoria Bain & Company, como em geral os prazos são curtos, este passo ajuda a focar no que é mais importante. Nesta fase, às vezes, cabem ajustes que fazem com que a técnica de problem solving da Bain seja ainda mais flexível. 2. Criando o plano de trabalho Este passo, segundo a consultoria, consiste em pen- sar sobre quais são as análises que faltam ser feitas, 80 definir quanto tempo cada uma vai demandar e quantas pessoas devem fazê-las. 3. Desenvolva a apresentação Neste penúltimo passo do problem solving, a eta- pa “Responda primeiro” continua servindo como orientação. A apresentação, no caso, demonstra a comprovação das respostas levantadas no início. Ainda que a etapa trate de “apresentação”, o geren- te de projetos afirma que as consultorias, de forma geral, estão partindo para modelos que privilegiam apresentações com menos slides e mais discussões. 4. Entregue os resultados Nesta fase, o foco principal não é simplesmente provar suas análises, mas, sim, procurar mover o cliente para uma ação – “que o cliente saiba o que fazer de diferente na segunda-feira de manhã”, explica. 81 METODOLOGIA BOSTON CONSULTING GROUP (BCG) Essa abordagem é dividida em três grandes passos com o objetivo garantir recomendações práticas e possíveis em curto espaço de tempo e com uso apropriado dos recursos disponíveis. Os 3 passos estão brevemente detalhados na sequência. 1. Estruturar o problema Nesta primeira etapa os consultores buscam en- tender de modo preciso e corretamente o proble- ma. Aqui, são definidas as hipóteses de trabalho, a abordagem que será utilizada e quais análises serão necessárias. 2. Realizar análises O propósito de realizar análises é comprovar (ou não) as hipóteses definidas na primeira etapa. Esta fase deve contemplar um plano de trabalho que inclua coletar dados, priorizar os passos mais importantes e definir como será a execução. 82 3. Traduzir resultados em insights e recomendações Com base nos fatos e dados coletados, a terceira etapa promove constatação de quais suposições foram comprovadas e refutadas. A partir disso, o consultor procura entender como a combinação dos resultados respondem às perguntas iniciais defini- das na estruturação. REFERÊNCIAS BIBLIOGRÁFICAS STATE UNIVERSITY. Learning: problem solving. StateUniversity.com, [s. l.], [s. d.]. Disponível em: https://education.stateuniversity.com/pages/2168/ Learning-PROBLEM-SOLVING.html#ixzz6krrCiYUW. Acesso em: 31 jan. 2021. BARBOSA, Suria. 3 técnicas de problem solving das maiores consultorias estratégicas do mundo. Na prática.org, [s. l.], 3 jul. 2020. Disponível em: https://www.napratica.org.br/tecnicas-consultoria- problem-solving/. Acesso em: 31 jan. 2021. 83 https://education.stateuniversity.com/pages/2168/Learning-PROBLEM-SOLVING.html#ixzz6krrCiYUW https://education.stateuniversity.com/pages/2168/Learning-PROBLEM-SOLVING.html#ixzz6krrCiYUW https://www.napratica.org.br/tecnicas-consultoria-problem-solving/ https://www.napratica.org.br/tecnicas-consultoria-problem-solving/ AULA 10 DASHBOARD A cada dia, o processo de tomada de decisão pre- cisa ser mais rápido e eficiente e, para isso, os ges- tores precisam transformar a grande quantidade de dados da empresa em conhecimento útil, o qual resultará em ações para benefício da corporação. 85 Neste cenário, surgiu a necessidade da elaboração de transmitir informações de maneira mais clara e objetiva, permitindo identificar os pontos mais crí- ticos para ações de correção e ajustes. Atualmente a maneira mais prática de apresentar informações de forma objetiva e de fácil compreensão é por meio de um painel de indicadores ou simplesmente dashboard. Os dashboards oferecem uma solução única e poderosa para a necessidade de informação de uma organização, mas eles geralmente ficam muito aquém do seu potencial. Os painéis devem ser vistos no contexto histórico para entender e apreciar como e por que eles surgiram, por que eles se tornaram tão populares e por que apesar de muitos problemas que prejudicam seu valor hoje, eles oferecem benefícios que va- lem a pena. (Few, 2006, p. 2) Um dashboard deve possibilitar o monitoramento dos resultados de uma organização por indicadores. Porém, antes de elaborar um dashboard, é preciso definir quais serão os indicadores utilizados. Para identificá-los, deve-se elaborar perguntas funda- mentais sobre o negócio e avaliar as respostas para entender se a informação obtida é verdadeiramente útil e eficiente. 86 É essencial compreender as reais necessidades da empresa para poder definir as métricas e indicado- res de desempenho para o acompanhamento. Por isso, neste momento, são utilizados os chamados Key Performance Indicators (KPIs). O que é um indicador-chave de desempenho? ● Um indicador chave de desempenho (KPI) fun- ciona como um meio de comunicação, transmitindo o objetivo a ser alcançado. ● Garante que todos entendam como o seu tra- balho é importante para o sucesso ou o fracasso do objetivo proposto. ● Normalmente um dashboard apresenta os principais KPIs referentes ao tema que está sendo monitorado. PRINCIPAIS CARACTERÍSTICAS DE UM DASHBOARD 1. Organização – Um dashboard tem que permitir uma experiência agradável e fácil percepção das informações. As áreas mais nobres (de maior foco) devem receber as informações mais relevantes. O limite deve ser uma tela ou uma folha A4. As infor- mações devem estar distribuídas de forma a facili- tar o entendimento. 87 2. Objetividade – Deverá sempre apresentar os KPIs mais relevantes para a conquista do objetivo. As informações devem ser claras e precisas, sem margem para dúvidas. 3. Facilidade para a identificação de problemas – O design e a apresentação das informações devem permitir facilmente a identificação de problemasou pontos de atenção, portanto, evite cores ou padrões que possam dificultar a interpretação das informações. Evite utilizar recursos que possam pre- judicar a atenção. 4. Métricas bem definidas – É fundamental definir métricas claras e capazes de medir corretamente a conquista do objetivo de forma que facilite tomar decisões ou mesmo ações de ajuste. 5. Dados de qualidade – Os dados são a base para as informações de um dashboard, logo, devem ser de fontes confiáveis, organizadas e homologadas, preferencialmente com processos de auditoria e controle regulares. 6. Facilidade de acesso – Devido ao grande nú- mero de recursos tecnológicos disponíveis, de- vemos considerar a facilidade de portabilidade e acesso ao dashboard por dispositivos diferentes, como notebooks, monitores, TVs e projetores, smartphones e tablets. 88 PLANEJAMENTO DE UM DASHBOARD A elaboração de um dashboard deve ser encarada como um projeto, portanto devemos respeitar algu- mas etapas: Definir o objetivo: Identificar a real necessidade dashboard, qual o propósito. Identifique o público: Quem terá acesso ao dashboard? É para uso interno ou externo? Qual o nível de informação deve conter? Defina os indicadores: A maioria dos dashboards é projetada em torno de um conjunto de KPI´s, identi- fique quais utilizar de acordo com o público alvo. Identifique as fontes de dados: Verifique o acesso às bases de dados e qual frequência de atualização. Se o acesso direto aos dados não for possível por questões de segurança, solicite cópias confiáveis e validadas. Defina grupos e filtros: Identifique a melhor forma de agrupar os dados, por exemplo: Por cliente; Por estado; Por produto; 89 Esboço: Lembre-se que um dashboard é um pro- jeto, portanto é recomendado realizar um esboço de como serão representados os dados. Você pode fazer um esboço simples, apenas para pré-visua- lizar como as informações serão exibidas. Repare que neste tipo de esboço é possível identificar se a forma de apresentação será realmente eficaz e caso necessário, fazer os devidos ajustes. Sempre que possível, faça um esboço mais detalhado CONFIGURAÇÕES RECOMENDADAS Definir um padrão de cores Sempre que possível evite: ● Gráficos com muitas cores; ● Com fundo escuro; ● Com efeitos de gradiente; ● Imagens carregadas; ● Efeitos de sombra; ● Efeitos 3D. Lembre-se, o objetivo de um dashboard é transmitir uma mensagem rapidamente e sem distrações. 90 Gráficos limpos ● Remova elementos gráficos desnecessários, como: ● Linhas de grade; ● Linhas de tendência; ● Legendas; ● Títulos de eixos; ● Rótulos de dados; ● Bordas; ● Fundos coloridos. Se o elemento for realmente necessário, simplifique o máximo possível. Mantenha a simplicidade Mantenha o foco apenas no objetivo do dashboard. Utilize somente as informações relevantes e não inclua informações apenas porque elas existem. CONFIGURAÇÕES INAPROPRIADAS Não estabelecer o objetivo do dashboard, sem um objetivo definido a ferramenta perde sua funcionalidade; 91 Não determinar o público-alvo do dashboard. Ao definir quem receberá as informações transmiti- das fica muito mais fácil e escolher as informações corretas e montar o painel; Cores em excesso, apesar de ser importante des- tacar alguns pontos, o excesso pode prejudicar a visualização e o entendimento das informações; Não utilize muitos efeitos visuais, assim como as cores, o excesso pode estressar os usuários e com- prometer a eficácia da ferramenta; Barra de rolagem nos painéis, o ideal é ter todas as informações disponíveis em uma única tela, portan- to não deve ser utilizada; Imagens desnecessárias podem deixar o painel confuso, prejudicar o foco e desviar a atenção dos usuários; Informações irrelevantes – Mantenha o foco no ob- jetivo principal do dashboard e no seu público-alvo. Não adianta ter um painel repleto de informações que não são úteis; Gráficos inadequados – Procure identificar o me- lhor gráfico para cada informação, repetir o mesmo 92 formato de gráfico fica cansativo e pode não trans- mitir a mensagem de forma correta; Bom exemplo DESTAQUE Tempo real GRÁFICO E TEXTO Disponibilidade e KPI MÉTRICAS GERENCIAIS PRIORIDADE Lista de Projetos ACOMPANHAMENTO Tráfego da Rede FONTES Few, S. (2006). Information dashboard design: The effective visual communication of data. Sebastopol, CA: O’Reilly Media. 93 AULA 11 STORYTELLING COM DADOS Storytelling é a capacidade de contar histórias re- levantes utilizando enredo elaborado, narrativa envolvente, utilizando sequência de visualizações e recursos audiovisuais trabalhando para transmitir informações 95 O storytelling capta a atenção das pessoas porque apresenta uma história na qual elas realmente se interessam. Isso porque ele contém assuntos com os quais os usuários lidam no dia a dia. O objetivo dessa construção narrativa é criar um vínculo emo- cional com o receptor da mensagem. O ser humano, não é naturalmente preparado para o Storytelling com Dados. Na escola, aprendemos muito sobre linguagem e matemática. Na lingua- gem, aprendemos como colocar palavras juntas em frases e em histórias. Com a matemática, aprende- mos a entender os números. Mas é raro que esses dois lados estão emparelhados: ninguém nos ensina como contar histórias com números. A tecnologia nos permitiu acumular maiores quanti- dades de dados e há um acompanhamento crescen- te desejo de dar sentido a todos esses dados. Ser capaz de visualizar dados e contar histórias com eles é a chave para transformá-los em informações que pode ser usado para conduzir a uma melhor tomada de decisão. Na ausência de habilidades naturais ou treinamento neste espaço, muitas vezes terminamos confiando em nossas ferramentas para entender as práticas recomendadas. Avanços tecnológicos, além de 96 aumentar a quantidade e o acesso a dados, tam- bém criaram ferramentas para trabalhar com dados generalizados. Qualquer um pode colocar alguns dados em um aplicativo gráfico (por exemplo, Excel) e criar um gráfico, porém sem um claro caminho a seguir, nos- sas melhores intenções e esforços podem nos levar a algumas direções muito ruins. É a capacidade de contar histórias relevantes utili- zando enredo elaborado, narrativa envolvente, utili- zando sequência de visualizações e recursos audio- visuais trabalhando para transmitir informações que faz o diferencial do Storytelling com Dados. STORYTELLING COM DADOS – 6 PASSOS 1. Compreensão do contexto 2. Escolha de exibição visual apropriada 3. Eliminar a desordem 4. Concentrar a atenção onde você deseja 5. Pensar como um designer 6. Contar uma história 97 1. COMPREENSÃO DO CONTEXTO Antes de iniciar o caminho da visualização de da- dos, há algumas perguntas que você deve ser capaz de res- ponder concisamente: ● Quem é seu público? ● O que você precisa que eles saibam ou façam? Aqui deve-se compreender a situação contexto, incluindo o público, mecanismo de comunicação e tom desejado. Perguntas importantes: ● Quais informações são relevantes ou fundamentais? ● Quem é o público ou o tomador de decisão? ● Quais dados disponíveis reforçariam nossa tese? Nosso público conhece esses dados? ● Onde estão os riscos que podem enfraquecer nossa tese? ● Como seria um resultado bem-sucedido? ● Se você tivesse tempo para apenas uma frase, o que diria ao seu público? 98 2. ESCOLHA DE EXIBIÇÃO VISUAL APROPRIADA O primeiro desafio é selecionar a melhor maneira de apresentar os dados. Existem algumas boas prá- ticas e gráficos para utilizar, a saber: 3. ELIMINAR A DESORDEM Imagine uma página em branco ou uma tela em branco: cada elemento que você adicionar a essa página ou tela ocupa carga cognitiva por parte de seu público - em outras palavras, leva o cérebro a processar. Portanto, queremos dar uma olhada criteriosa nos elementos visuais que permitimos em nossas comu- nicações. Em geral, identifique qualquer coisa que não está agregando