Baixe o app para aproveitar ainda mais
Prévia do material em texto
- -1 FERRAMENTAS DE DASHBOARD UNIDADE 2 - VISUALIZAÇÃO DE DADOS MULTIDIMENSIONAIS ELTON SARMANHO SIQUEIRA - -2 Introdução Neste capítulo apresentaremos a visualização de dados multidimensionais, representações visuais e algumas estratégias que correspondem ao contexto. Você também conhecerá várias estruturas, técnicas e ferramentas que utilizam dados multidimensionais. Você sabe qual é a importância de visualizarmos dados multidimensionais? Será que existe somente uma solução para visualizarmos um conjunto de dados dessa natureza? Conforme a natureza dos dados, qual é a melhor visualização a ser utilizada? Vamos apresentar os fundamentos básicos da visualização de dados multidimensionais, mostrando a importância dessa área de estudo e como podemos representar e agrupar esses dados da melhor forma possível a fim de que empresas e gestores possam tomar decisões precisas e consistentes sobre seus negócios. 2.1 Pesquisa por ferramentas de para dados dashboard multimodais Com o rápido desenvolvimento de recursos tecnológicos para capturar dados a partir de diversas fontes (redes sociais, aplicativos de mensagens entre outros) tem-se produzido um aglomerado de dados cada vez mais volumoso e complexo (considerando a tipagem: textos, imagens, áudio, vídeo etc.). A exploração e a análise dessa massa de dados tornou-se uma tarefa árdua que somente pode ser executada com o uso de ferramentas computacionais adequadas, as chamadas , que algumas vezes dependem dodashboard domínio dos dados. Isso é uma questão problemática quando nos deparamos com dados de N-dimensionalidade, pois correspondem a conjuntos de vários atributos. O campo da visualização de informações visa a facilitar o entendimento e a interação dessa massa de dados diversificada (SPENCER, 2000) por meio do uso de técnicas e interações que buscam representar visualmente os dados para auxiliar o usuário no que diz respeito à percepção. As técnicas de visualização multidimensionais são planejadas para a representação de dados que possui N- dimensionalidade (caracterizados por múltiplos atributos) e que, normalmente, são representados por estrutura tabular, em que cada linha corresponde a um objeto de dado, com as colunas representando os respectivos atributos. Apesar da existência de várias técnicas para exibir dados multidimensionais, pode ser que o uso exclusivo de uma técnica não seja suficiente, pois natureza/domínio dos dados impacta fortemente no processo de compressão, logo, o usuário, provavelmente, precisará visualizar os dados usando diferentes técnicas a fim de buscar ou descobrir novos relacionamentos e informações. - -3 Um termo importante a ser discutido é o da , que é usado para referir-se tanto ao número dedimensionalidade dimensões do espaço quanto aos atributos de um objeto e pode ser classificado em: , unidimensional (1D) , ou .bidimensional (2D) tridimensional (3D) N-dimensional (nD) Desta forma, dados multidimensionais são aqueles que podem ser caracterizados como uma tabela de dados multivariados, em outras palavras, que detém muitas variáveis (também chamado de atributos) as quais devem ser organizadas em uma estrutura visual 1D, 2D ou 3D (CARD ., 1999). Como exemplo, podemos mostrar umet al esquema de uma tabela de dados multivariados em que as colunas da tabela configuram as variáveis (ou atributos). As linhas representam os registros de dados e as células são os valores que de fato correspondem a um determinado atributo. Figura 1 - Esquema da Tabela de Dados Multivariado. Fonte: PILLAT, 2006, p. 16. VOCÊ SABIA? Conforme estudos feito por Baldonado . (2000), que explora o contexto e os problemaset al sobre o uso de dados multidimensionais, o respectivo trabalho mostra a abordagem chamada “Múltiplas Visualizações Coordenadas” ( ), a qual visa a reduzirCoordinated Multiple Views alguns problemas encontrados ao se trabalhar com dados N-dimensionais. Nessa abordagem, temos diferentes visualizações que podem ser combinadas em um ambiente e utilizadas de forma coordenada, ou seja, instituindo-se uma ligação semântica entre as visualizações de tal forma que as ações sobre uma se reflitam nas demais. Assim, com abordagem de Múltiplas Visualizações Coordenadas podemos obter vantagens de cada visualização de modo que os dados possam ser visualizados por meio de técnicas apropriadas e pré-definidas. - -4 Agora que você possui o entendimento sobre a visualização de dados multidimensionais, podemos ver agora as suas representações visuais e as técnicas de visualizações de informações, assuntos dos próximos tópicos. Vale ressaltar que uma vez que são coletados os dados, eles devem ser categorizados e agrupados conforme a sua natureza. Entretanto, reuni-los de forma ordenada e lógica não é uma tarefa fácil e, nesse caso, utilizamos como meio de obter sucesso nessa tarefa. O conceito de será apresentado no tópico as dashboard dashboard seguir. 2.2 Dashboard Few (2006) conceitua um como um virtual das informações mais relevantes para alcançar umdashboard display ou mais objetivos. Normalmente, é construído e estruturado para ser capaz de enquadrar em uma única tela para que a informação seja encontrada com facilidade. O estudo feito por Schwendimann (2016) apresenta uma revisão sistemática sobre e mostra queet al. dashboard o gráfico de barras, o gráfico de linhas e as tabelas são os mais encontrados em um . A seguirdashboard conceituamos cada deles. • Gráfico de Barras: esse tipo de gráfico mostra os dados categorizados em barras retangulares de modo que uma barra corresponde a uma categoria e o tamanho é proporcional ao número de observações na respectiva categoria. Esse tipo de gráfico é muito usado para realizar comparações entre as categorias de uma variável. Este gráfico pode ser utilizado na vertical ou horizontal, como vemos na figura a seguir (DOUMONT; VANDENBROECK, 2002). VOCÊ O CONHECE? Stephen Few tem mais de 20 anos de experiência como inovador, consultor e educador nos campos de (também conhecido como ) e design debusiness intelligence decision support informação. Através de sua empresa, a , ele se concentra na análise eficaz e naPerceptual Edge apresentação de informações de negócios quantitativos. Few é reconhecido como um líder mundial no campo da visualização de dados, leciona regularmente em conferências como as apresentadas pelo (TDWI) e também no programa de MBA da The Data Warehousing Institute , na Universidade de Berkeley. Few é o autor do livro “Show Me theHaas School of Business Numbers: Designing Tables and Graphs to Enlighten” (2004) e para saber mais detalhes ele, acesse: .http://www.stephen-few.com/ • http://www.stephen-few.com/ - -5 Figura 2 - Gráfico de Barra. Fonte: XCEPTICZP, 2007. • Gráfico de Linhas: normalmente, visa a apresentar um conjunto de dados numéricos ao longo do tempo. É fortemente indicado para mostrar evoluções (ou regressões lineares) que ocorrem a partir de um conjunto de dados sequenciais ou não, de modo a verificar o comportamento do fenômeno observado. Recomendado quando se tem um conjunto de dados contínuos. • - -6 Figura 3 - Gráfico de Linha. Fonte: PORTALACTION, [201-]. • Gráfico de Pizza: é frequentemente utilizado quando se quer comparar um setor em relação ao total. Esse gráfico possui uma estrutura circular com segmentos divididos pela proporção dos subconjuntos de dados, ou seja, cada segmento representa uma categoria e a soma dos segmentos forma o todo. Veja a seguir um exemplo desse gráfico. • - -7 Figura 4 - Gráfico de Pizza. Fonte: PORTALACTION, [201-]. Outra questão relevante no desenvolvimento de um é o uso da paleta de cores. Ying e Anshul (2015)dashboard afirmam que a possui papel fundamental no de e impacta diretamente na percepção docor design layout observador. Os autores elaboraram uma tabela (pode ser vista logo a seguir) que relaciona uma determinada com cor a uma respectiva mensagem. Conforme o trabalho feito por Santos (2017) existe uma combinação de cores para um , em que seria preto eazul por transmitir calma, segurança e autoridadedashboard - -8 Quadro 1 - Mapeamento de Cores e seus Significados. Fonte: Elaborado pelo autor, baseado em SANTOS, 2017. Em seus estudos, Few (2006) verifica diversos exemplos de s. Um bom exemplo pode ser visto nadashboard figura a seguir apresenta agradável para mostrar a informação.design - -9 Figura 5 - Exemplo de Dashboard. Fonte: SANTOS, 2017, p 43. Considera-se a figura um bom exemplo devido ao uso do espaço em branco para separar as seções que são visualizadas e, além disso, o uso da paleta de cores colabora para uma ótima visualização, em que somente as cores detectadas são os tons de cinza, verde e dois tons de vermelho. Por fim, ressalta-se que toda a informação relevante se encontra em um único e é organizada logicamente, facilitando a leitura por parte dolayout observador. A partir do entendimento básico sobre podemos explorar outras técnicas de visualizaçõesdashboard VOCÊ QUER VER? O estatístico Ola Rosling, da , desenvolveu um dashboard intitulado “Google Public Data Google ” que demonstra a eficácia da visualização de conjuntos de dados. Ele fezPublic Data Explorer uma apresentação dessa ferramenta na . Rosling foi umBerkeley Graduate School of Journalism dos fundadores da Fundação e liderou o desenvolvimento do , um Gapminder Trendalyzer que converte estatísticas de séries temporais em gráficos animados, interativos esoftware compreensíveis. O objetivo de seu trabalho é promover uma visão de mundo baseada em fatos através do aumento do uso e da compreensão de dados públicos e de livre acesso. Para saber detalhes da ferramenta, acesse: .https://www.youtube.com/watch?v=RgA4aaEfgPQ https://www.youtube.com/watch?v=RgA4aaEfgPQ - -10 A partir do entendimento básico sobre podemos explorar outras técnicas de visualizaçõesdashboard multidimensionais que contribuem para enriquecer nosso painel de visualização de dados. 2.2.1 Visualizações multidimensionais Há um conjunto imenso de técnicas voltadas para visualização de dados multidimensionais, entretanto, em nossa disciplina, estaremos direcionados a mostrar algumas técnicas tradicionais enfatizando as mais representativas (frequentemente utilizadas em ) e citadas na literatura acadêmica. Essas técnicas serão apresentadasdashboard conforme o critério de classificação definido por Keim (1996), em que autor diferencia tais técnicas conforme a forma de mapeamento adotada para transformar dados em formas visuais. As visualizações que são projetadas para decodificar dados que podem ser mostrados em formas de tabelas multivariável são chamadas de . As técnicas de visualizaçãovisualizações multidimensionais multidimensionais podem ser classificadas conforme alguns critérios, segundo Keim (1996) em (clique para ler): i) a natureza do dado a ser visualizado; ii) a maneira de como o mapeamento é seguido pela técnica; iii) os procedimentos de interação relacionados à manipulação da representação visual. Baseado nesse critério de classificação as técnicas podem ser divididas em: técnicas de projeção geométrica, iconográficas e orientadas a pixel. 2.2.2 Técnicas de projeção geométrica Nessa categoria de visualização temos a utilização de algum tipo de projeção geométrica para mapear dados para formas visuais e dentre as principais técnicas desta classe estão: Coordenadas Paralelas, Matriz de Scatter , gráficos de linhas, gráfico de barras e histogramas, , Curvas de Andrews e Radviz. Cada umaPlots Survey Plots dessas técnicas será explicada de forma macro com uso de exemplos. • Coordenadas Paralelas: Essa técnica foi proposta por Inselberg (1985) para mostrar múltiplas dimensões sem usar eixos cartesianos. Nessa abordagem, os dados multidimensionais são projetados usando linhas verticais e horizontais. Cada linha no sentido vertical corresponde a uma variável e os valores dessas variáveis são mapeados para pontos nessas linhas verticais, de tal modo que cada tupla (ou item de dado) seja mostrado como uma linha reta horizontal que intercepta cada linha vertical em seu ponto representativo, gerando um acumulado de linhas horizontais. Os valores extremos (mínimo e máximo) de uma variável são, normalmente, configurados na extremidade superior e inferior de uma linha vertical. Além disso, a técnica de coordenadas paralelas ajuda na compreensão de algumas características, como as diferenças na distribuição dos dados e as correlações entre variáveis. A seguir, mostramos um exemplo da técnica de coordenadas paralelas. • - -11 Figura 6 - Coordenadas Paralelas. Fonte: INGENIOVIRTUAL, [201-]. • Matriz de Scatter Plots: Primeiramente, devemos apresentar a como uma técnica na qual Scatter Plot pontos (itens de dados) são projetados em coordenadas (x, y) semelhantes aos outros gráficos 2D. Desta forma, podemos dizer que Matriz de é uma extensão da técnica voltada para a Scatter Plots Scatter Plot visualização de dados multidimensionais. Essa técnica exibe concomitantemente múltiplas visualizações bidimensionais dos diferentes pares de variáveis do conjunto de dados. Veja como funciona: temos um conjunto de dados com 4 dimensões, logo, podemos ter uma matriz 4 x 4 (4 linhas e 4 colunas) a qual é usada para fornecer a visualização de cada dimensão todas as outras. Podemos verificar que a versus técnica é de fácil interpretação quando utilizada corretamente, pois fornece a visualização de todas as possíveis correlações entre os pares de atributos (ou variáveis). A figura a seguir apresenta um exemplo de visualização gerada com a técnica Matriz de .Scatter Plots • - -12 Figura 7 - Matriz de Scatter Plots. Fonte: STDHA, [201-]. • Histogramas: uma representação gráfica da distribuição de frequências de um conjunto de dados (geralmente contínuos) e representada por barras verticais ou barras horizontais. É um modelo que mede a distribuição das frequências ou dos intervalos em relação a determinadas amostras ou grupos. Logo, podemos considerar como um método estatístico que mede a real situação em questão. • - -13 Figura 8 - Histograma. Fonte: ABRITO, 2013. • : é uma representação gráfica em que os dados de cada dimensão são mapeados para linhas Survey Plots estendidas a partir de um elemento central (LOHNINGER, 1994). O comprimento de cada linha está em correspondência ao valor do item de dado sendo representado. A visualização de possibilita Survey Plots realizar correlações entre duas dimensões do conjunto de dados. Mostramos um exemplo de visualização a seguir, em que temos conjunto de dados “ ”.Survey Plots Iris Flower Data Set • - -14 Figura 9 - Survey Plot. Fonte: ORANGE, [201-]. • Curvas de Andrews: Andrews (1971) propôs um método baseado na transformação de Fourier para representar dados multivariados em duas dimensões. Cada ponto k dimensional é representado por uma função F(x). Pode-se mostrar que essa representação preserva as distâncias euclidianas, no sentido de que dois elementos da população com valores semelhantes das variáveis correspondem a curvas próximas. Cada variável de cada observação é representada por um componente individual na soma da transformada de Fourier. A magnitude de cada variável de um determinado elemento afeta a frequência, amplitude e periodicidade da função, dando uma representação única para cada sujeito. • - -15 Figura 10 - Curva de Andrews. Fonte: WIKIPEDIA, [201-]. • Radviz: nessa representação visual temos que "n" linhas, correspondentes à "n dimensões", derivam radialmente do centro de um círculo e se direcionam ao perímetro, em pontos uniformemente espaçados chamados de (HOFFMAN ., 1997). Cada item de dado projetado está dimensional anchors (DAs) et al conectado por meio de molas imaginárias às DAs e a posição em que são visualizados é aquela em que existe uma estabilidade das forças das molas associadas a cada dimensão. De certa forma, cada ponto de dado é apresentado especificamente em que a soma das forças das molas é respectivamente igual à zero. Além disso, os valoresdos itens de dados são comumente normalizados para valores na faixa entre 0 e 1 (FAYYAD; GRINSTEIN; WIERSE, 2002). Alguns pontos importantes dessa representação: i) valores maiores dos atributos fazem com que o ponto projetado fique em regiões próximas aos eixos associados a estes atributos; ii) itens de dados com valores de atributos similares (após o processo de normalização) são posicionados adjacentes ao centro do círculo. Temos um exemplo a seguir dessa técnica. • - -16 Figura 11 - RadViz. Fonte: SCIKIT, [201-]. Nesse ponto concluirmos apresentação de principais técnicas de projeção geométrica. Na próxima seção abordaremos de forma macro algumas representações Iconográficas. 2.2.3 Iconográficas As principais visualizações do tipo iconográficas são e . Em cada uma destas representações asglifos ícones dimensões de um conjunto de dados são mapeadas conforme algumas características. Podemos considerar a técnica de (CHERNOFF, 1973) uma das mais conhecidas na literaturaFaces de Chernoff acadêmica com respeito às visualizações iconográficas. Na referida técnica temos que as dimensões dos dados são exclusivamente mapeadas utilizando as configurações de uma face por inteira (veja figura a seguir), provindo diversos formatos de faces (predefinida conforme os valores mapeados). Entretanto, a eficácia desta VAMOS PRATICAR? Apresentamos alguns exemplos de visualização de dados usando representação de Projeção geométrica. Faça uma pesquisa sobre essa mesma categoria de representação visual e faça um texto apresentando 2 ou 3 técnicas que não estejam nesse tópico. - -17 provindo diversos formatos de faces (predefinida conforme os valores mapeados). Entretanto, a eficácia desta técnica é questionada pela dificuldade e pela limitação de percepção de imagens e pela mesma ser, algumas vezes, imprópria para a identificação de agrupamentos. Figura 12 - Faces de Chernoff. Fonte: AVENUE, 2010. Nesse ponto concluirmos apresentação da principal técnica das representações Iconográficas. Na próxima seção abordaremos de forma ampla as representações orientadas a pixel. VAMOS PRATICAR? Apresentamos alguns exemplos de visualização de dados usando representações Iconográficas. Faça uma pesquisa sobre essa mesma categoria de representação visual e faça um texto apresentando 1 ou 2 técnicas que não estejam nesse tópico. - -18 2.2.4 Orientadas a pixel As técnicas dessa classe qualificam-se por mapear um grupo de valores de cada dimensão dos dados em pixels no . O grupo de valores de cada dimensão é apresentado em um recorte de tela (janela) individual, emdisplay outras palavras, para um grupo de dados que possui dimensões, a tela é segmentada em menores.n n janelas Além disso, para cada uma das janelas temos que cada valor da dimensão é constituído por um pixel colorido de acordo com o valor que está sendo representado. Devemos considerar que a distribuição espacial dos pixels na janela pode ser definida de diversas maneiras, de tal modo que as relações nos dados possam ser compreendidas pela análise das áreas correspondentes nas janelas (KEIM, 1996). As técnicas com propósito de realizar a distribuição espacial dos pixels são divididas em: técnicas independentes e dependentes de consulta. Na primeira, os valores das dimensões são mapeados para os pixels e mostrados nas janelas. Nesse caso, usam-se as curvas de preenchimento de espaço (curvas de Peano-Hilbert ou Morton) ou espiral, que garantem um agrupamento consistente sobre os itens de dados relacionados e uma melhor distribuição destes. Como exemplo, veja figura a seguir que mostra uso dessa técnica. Figura 13 - Técnicas independentes de consulta: a) Padrão Espiral; b) Curvas de Peano-Hilbert; c) Curvas de Morton. Fonte: KEIM, 1996, p. 24. Temos ainda as técnicas dependentes de consulta, que ao contrário dos valores das dimensões serem mapeados para pixels, as distâncias destes valores a uma respectiva consulta é que são mapeadas. Desta maneira, além dos itens de dados que estão inclusos conforme os critérios da consulta, também são apresentados aqueles valores que ficam próximos da resposta por meio da apresentação da distância de cada valor a um respectivo valor estabelecido na consulta. O processamento da distância é diretamente dependente da aplicação ou natureza dos dados. As dimensões referentes a um item de dado alocam a mesma posição relativa nas suas respectivas janelas, sendo que a sequência de apresentação dos itens de dados na janela é definida por uma distância global. O processamento dessa distância é realizado pela combinação das distâncias de cada dimensão, ponderadas por um peso correspondente, que define a importância dada a dimensão. - -19 Com a respectiva técnica podemos ter as seguintes representações visuais: , em que as respostasem espiral certas são mostradas no centro do display e os valores vizinhos ao redor desta área; ou , indicandopor eixos distâncias positivas e negativas, como vemos na figura a seguir. Figura 14 - Técnicas dependentes de consultas: espiral (esquerda) e por eixos (direita). Fonte: KEIM, 1996, p. 26. Nesse ponto concluirmos a apresentação das principais técnicas das representações orientadas a pixel. Na próxima seção abordaremos algumas representações em redes e hierárquicas. 2.3 Visualização de dados em redes e hierárquicos A representação visual com que as informações são apresentadas ao observador tem um impacto direto no processo de extração do conhecimento de um determinado sistema de visualização de informações e é fortemente dependente dos dados. VOCÊ QUER LER? Existem textos acadêmicos que apresentam outras técnicas com relação às representações orientadas a pixel que mostram melhorias na percepção dos relacionamentos entre os atributos. A seguinte dissertação de mestrado trata desse assunto. Acesse: https://lume.ufrgs. .br/handle/10183/12423 https://lume.ufrgs.br/handle/10183/12423 https://lume.ufrgs.br/handle/10183/12423 - -20 Conforme Shneiderman (1996), conceituamos os dados hierárquicos e rede da forma como vemos a seguir. • Hierárquico: geralmente, é representado por diagramas com nós, com ligações entre os mesmos e é muito usado em algoritmos de classificação de dados. Veja o exemplo de um dendrograma. Figura 15 - Dendrograma. Fonte: MINITAB, [201-]. • Rede: estes são caracterizados por nós ou nodos conectados por ligações previamente definidas. Essas ligações podem ser estruturadas em árvores (ver figura a seguir). CASO Com ascensão do "Big Data”, a visualização se tornou incrivelmente importante para interpretar e melhor compreender os dados gerados por diversas fontes existentes. A visualização auxilia na decodificação dos dados, tornando-os um formato mais compreensível ao usuário, destacando tendências e padrões existentes. No Brasil, temos vários desenvolvedores, pesquisadores e empresas focados nesse ramo. Um pesquisador em destaque é professor Bianchi Serique, que desenvolveu uma ferramenta robusta para análise multivariada de dados (considerando grande base de dados), chamada "Prisma" (PRISMA - A ). UsandoMultidimensional Information Visualization Tool Using Multiple Coordinated Views essa ferramenta ele obteve sucesso sobre a análise de dados geográficos e sociais. Para mais detalhes sobre autor e a ferramenta, acesse: https://scholar.google.com.br/citations? .user=YM9xFA8AAAAJ&hl=pt-BR • • https://scholar.google.com.br/citations?user=YM9xFA8AAAAJ&hl=pt-BR https://scholar.google.com.br/citations?user=YM9xFA8AAAAJ&hl=pt-BR - -21 Figura 16 - Estrutura de rede de dados. Fonte: KISSPNG, [201-]. A partir desses breves conceitos sobre dados em redes e hierárquicos, abordaremos algumas técnicas de visualizações que utilizam os mesmos. Nesse caso, vamos abordar Treemap e Grafo. 2.3.1 Treemap A técnica chamada atende os casos em que dados são de natureza hierárquicas. A respectiva técnica fazTreemap uso de 100% do espaço disponível na tela para mostrar uma estrutura hierárquica e consiste em exibir o nível mais alto da hierarquia comouma área retangular que ocupa todo o espaço da figura (JOHNSON; SHNEIDERMAN, 1991). Já os níveis mais baixos são projetados recursivamente como retângulos dentro da área maior. Devemos considerar que o tamanho de cada retângulo é diretamente proporcional à quantidade de itens de - -22 Devemos considerar que o tamanho de cada retângulo é diretamente proporcional à quantidade de itens de dados nos níveis imediatamente abaixo na hierarquia. A visualização do é dependente do algoritmo atreemap ser adotado e destacam-se: , e . Um exemplo dessa técnica é mostrado a seguir.slice and dice cluster squarified Figura 17 - Treemap. Fonte: REEMAP, [201-]. A seguir veremos sobre os grafos. Acompanhe! 2.3.2 Grafos Um grafo G = (V, E) é modelo matemático constituído por um conjunto V de vértices e um conjunto E de arestas em que cada aresta é um par de vértices (Ex.: (a, b), com base na figura abaixo). A representação visual de um grafo consiste em círculos preenchidos para vértices e curvas (ou retas) para arestas. Abaixo mostramos um exemplo de grafo: - -23 Figura 18 - Grafo Fonte: NASCIMENTO; FERREIRA, 2019, p. 1282. A representação visual de Grafos é uma das técnicas geralmente usadas para apresentar relações entre objetos (DI BATTISTA ., 1999) em rede. Existem diversas aplicações, desde eletrônica (projeção de circuitos VLSI)et al chegando ao campo de estudo da Engenharia de (apresentando estruturas modulares de programasSoftware durante processo de desenvolvimento de software). Os grafos podem ser representados visualmente por diversas estruturas de dados. Vamos focar em uma estrutura academicamente conhecida por Matriz de adjacência. Uma matriz de adjacência pode ser definida estabelecendo o número de vértices de um grafo , logo uman G matriz de adjacência (A) para G é uma matriz pertence (Conjunto dasA = (aij) n X n tal que aij = 1 se (vi,vj) E arestas). Na figura a seguir temos um exemplo dessa estrutura. Figura 19 - Matriz de adjacência. Fonte: WIKICIENCIAS, [201-]. Veremos a seguir sobre pacotes e ferramentas para visualizar dados. VAMOS PRATICAR? Apresentamos algumas técnicas que utilizam dados em redes e hierárquicos. Entretanto, existem outras técnicas utilizadas que não estão no escopo desse material, por exemplo, força dirigida, lista de adjacências, icicletree, sunburst e etc. Faça um texto dissertativo que apresente 3 técnicas que utilizam esses dados e que não estejam presentes nesse material. - -24 2.3.3 Pacotes e Ferramentas para visualização de dados Vários pacotes e ferramentas que auxiliam no processo de desenvolvimento de visualizações, como vemos a seguir (clique para ler). 1 Graphviz – Open source library com finalidade de elaborar grafos. 2 JGraph – Open source library em Java para elaboração de grafos. 3 XmdvTool – Pacote para visualizar dados multidimensionais.open source 4 Matplotlib – Biblioteca em para visualizar dados multidimensionais.python 5 Linguagem R – Consideramos um ambiente de programação que visa à manipulação, análise e visualização gráfica de dados. Quando o usuário não detém certo conhecimento em linguagem de programação, há a alternativa de usar linguagem R que, de certa forma, é muito intuitiva e proporciona resultados excelentes. Síntese Finalizamos este estudo introdutório, que apresentou os conceitos de visualização de dados multidimensionais. Além disso, neste capítulo você teve a oportunidade de: Nesta unidade, você teve a oportunidade de: • conhecer técnicas de visualizações não tradicionais de dados multidimensionais; • conhecer conceito de dados hierárquicos e redes; • conhecer algumas visualizações que utilizam dados em redes e hierárquicos; • conhecer alguns pacotes e ferramentas para ajudar em projetos de visualização de dados multidimensionais. Bibliografia ABRITO. Histograma de um grupo de 18 pacientes. , 2013. Disponível em: Wikipédia https://pt.wikipedia.org /wiki/Histograma#/media/Ficheiro:Histograma_wiki1.png. Acesso em: 26 ago. 2019. ANDREWS, L. F. o conceito e o aparelho. Califórnia: L. A. Wells, 1971.Straight wire: AVENUE. , 2010. Disponível em: This example shows Chernoff faces for lawyers' ratings of twelve judges https://en.wikipedia.org/wiki/Chernoff_face#/media/File:Chernoff_faces_for_evaluations_of_US_judges.svg. Acesso em: 26 ago. 2019. BALDONADO, M. Q.; WOODRUFF, A.; KUCHINSKY, A. Guidelines for using multiple views in information . : Proceedings of the working conference on Advanced visual interfaces (AVI '00). New York:visualization In ACM, 2000. p. 110-119. CARD, S. K.; MACKINLAY, J. D.; SHNEIDERMAN, B.; CARD, M. usingReadings in Information Visualization: vision to think. : Kaufmann, M. . Amsterdam:In Series in Interactive Technologies Academic Press, 1999. CHERNOFF, H. The use of faces to represent points in k-dimensional Space Graphically. Journal Amer. , v. 68, p. 361-368, 1973.Statistical Association DI BATTISTA, G. . Algorithms for drawing graphs: an annotated bibliography. .,et al Comput. Geom. Theory Appl • • • • https://pt.wikipedia.org/wiki/Histograma#/media/Ficheiro:Histograma_wiki1.png https://pt.wikipedia.org/wiki/Histograma#/media/Ficheiro:Histograma_wiki1.png https://pt.wikipedia.org/wiki/Histograma#/media/Ficheiro:Histograma_wiki1.png https://en.wikipedia.org/wiki/Chernoff_face#/media/File:Chernoff_faces_for_evaluations_of_US_judges.svg https://en.wikipedia.org/wiki/Chernoff_face#/media/File:Chernoff_faces_for_evaluations_of_US_judges.svg - -25 DI BATTISTA, G. . Algorithms for drawing graphs: an annotated bibliography. .,et al Comput. Geom. Theory Appl v. 4, p. 235–282, 1994. DOUMONT, J. L.; VANDENBROECK, P. Choosing the right graph. IEEE transactions on professional , v. 45, n. 1, p. 1–6, 2002.communication FAYYAD, U.; GRINSTEIN, G. G.; WIERSE, A. Information visualization in Data Mininig and Knowledge . San Francisco: Academic Press, 2002.Discovery FEW, S. - The effective visual comunication of data. Sebastopol: O’Reilly, 2006.Information Design Dashboard FEW, S. , 2019. Disponível em: http://www.stephen-few.com/. Acesso em: 25 ago. 2019.Stephen Few FORATV. Google's public data explorer: A New Tool for Visualizing Information. , 2 jun. 2010. DisponívelYoutube em: . Acesso em: 25 ago. 2019.https://www.youtube.com/watch?v=RgA4aaEfgPQ HERMAN, I; MELANÇON, G.; MARSHALL, M. S. Graph Visualization and navigation in information visualization: a survey. , v. 6, n. 1, p. 24-42, 2000.IEEE Transactions on Visualization and Computer Graphics HOFFMAN, P. E. . . : IEEE Proceedings e Visualizations, 1997.et al DNA Visual and Analytic Data Mining In Phoenix: IEE, 1997. INGENIOVIRTUAL. , [201-]. Disponível em: Gráfico de coordenadas paralelas https://www.ingeniovirtual.com /wp-content/uploads/grafico-de-coordenadas-paralelas.jpg. Acesso em: 26 ago. 2019. INSELBERG, A. The Plane with Parallel Coordinates. , New York, v. 1, p. 69-91, 1985.The Visual Computer Special Issue on Computational Geometry. JOHNSON, B.; SHNEIDERMAN, B. Tree-maps: a space-filling approach to the visualization of hierarchical information structures. : . IEEE ComputerIn VIS ’91: Proceedings of the 2nd conference on Visualization ’91 Society Press. p. 284–291. Disponível em: https://www.cs.umd.edu/~ben/papers/Johnson1991Tree.pdf. Acesso em: 28 ago. 2019. KEIM, D. A. , New York, v. 8, n. 6, 1996.Transactions on knowledge and data engineering KEIM, D. A. . : INTERNATIONAL CONFERENCE IN KNOWLEDGEVisual database exploration techniques In DISCOVERY AND DATA MINING, KDD/97. New Port Beach, 1997. KEIM, D. A. Visualization Techniques for Mining Large Database: A Comparation. Transactions on Knowledge , New York, v. 8, n. 6, 1996.and Data Engineering KISSPNG. , [201-]. Disponível em: Data visualization computer network mappin https://banner2.kisspng.com /20180326/gww/kisspng-data-visualization-computer-network-network-mappin-network-5ab969a0617579. 3609138615221006403992.jpg. Acesso em: 27 ago. 2019. LI, Y.; SHEOPURI, A. Creative design of color palettes for product packaging. : In IEEE International Conference ,Torino, 2015. p. 1–6.on Multimedia and Expo (ICME) LOHNINGER, H. INSPECT: a program system to visualize and interpret chemical data. Chemometrics and , v. 22, n. 1, p. 147-153, 1994.Intelligent Laboratory Systems MINITAB. , [201-]. Disponível em: Dendograma https://support.minitab.com/pt-br/minitab/18 /cluster_obs_dendrogram_with_final_partition_glove_testers.png. Acesso em: 26 ago. 2019. NASCIMENTO, H.; FERREIRA, C. . Livro Texto da XXIVVisualização de Informações – Uma Abordagem Prática Jornada de Atualização em Informática, 2019. p. 1262–1312. ORANGE. , [201-]. Disponível em: Survey Plot https://docs.biolab.si//2/widgets/rst/visualize/surveyplot.html. Acesso em: 26 ago. 2019. PILLAT, R. M. . 2006. 206 f. DissertaçãoCoordenação dinâmica de visualizações de dados multidimensionais (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Sul, Porto Alegre, 2006. Disponível em: https://lume.ufrgs.br/handle/10183/12423. Acesso em: 26 ago. 2019. PORTALACTION. , [201-]. Disponível em: Estatística básica http://www.portalaction.com.br/sites/default/files /resize/EstatisticaBasica/figuras/ex3.3.2-500x500.png. Acesso em: 25 ago. 2019. SANTOS, L. M. . 2017. 85Criação de um para monitoramento de perfis de qualidade de softwaredashboard f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Software) - Universidade de Brasília, Brasília, 2017. Disponível em: http://bdm.unb.br/handle/10483/19778. Acesso em: 25 ago. 2019. SCHWENDIMANN, B. et al. Perceiving learning at a glance: A systematic literature review of learning dashboard https://www.youtube.com/watch?v=RgA4aaEfgPQ https://www.ingeniovirtual.com/wp-content/uploads/grafico-de-coordenadas-paralelas.jpg https://www.ingeniovirtual.com/wp-content/uploads/grafico-de-coordenadas-paralelas.jpg https://www.ingeniovirtual.com/wp-content/uploads/grafico-de-coordenadas-paralelas.jpg https://www.cs.umd.edu/~ben/papers/Johnson1991Tree.pdf https://www.cs.umd.edu/~ben/papers/Johnson1991Tree.pdf https://banner2.kisspng.com/20180326/gww/kisspng-data-visualization-computer-network-network-mappin-network-5ab969a0617579.3609138615221006403992.jpg https://banner2.kisspng.com/20180326/gww/kisspng-data-visualization-computer-network-network-mappin-network-5ab969a0617579.3609138615221006403992.jpg https://banner2.kisspng.com/20180326/gww/kisspng-data-visualization-computer-network-network-mappin-network-5ab969a0617579.3609138615221006403992.jpg https://banner2.kisspng.com/20180326/gww/kisspng-data-visualization-computer-network-network-mappin-network-5ab969a0617579.3609138615221006403992.jpg https://support.minitab.com/pt-br/minitab/18/cluster_obs_dendrogram_with_final_partition_glove_testers.png https://support.minitab.com/pt-br/minitab/18/cluster_obs_dendrogram_with_final_partition_glove_testers.png https://support.minitab.com/pt-br/minitab/18/cluster_obs_dendrogram_with_final_partition_glove_testers.png https://docs.biolab.si//2/widgets/rst/visualize/surveyplot.html https://docs.biolab.si//2/widgets/rst/visualize/surveyplot.html https://lume.ufrgs.br/handle/10183/12423 https://lume.ufrgs.br/handle/10183/12423 http://www.portalaction.com.br/sites/default/files/resize/EstatisticaBasica/figuras/ex3.3.2-500x500.png http://www.portalaction.com.br/sites/default/files/resize/EstatisticaBasica/figuras/ex3.3.2-500x500.png http://www.portalaction.com.br/sites/default/files/resize/EstatisticaBasica/figuras/ex3.3.2-500x500.png http://bdm.unb.br/handle/10483/19778 http://bdm.unb.br/handle/10483/19778 - -26 SCHWENDIMANN, B. et al. Perceiving learning at a glance: A systematic literature review of learning dashboard research. , 2016.IEEE Transactions on Learning Technologies SCIKIT. Radviz for 5 features, [201-]. Disponível em: https://www.scikit-yb.org/en/latest/_images/radviz.png. Acesso em: 27 ago. 2019. SCIKIT. , [201-9]. Disponível em: Radviz https://www.scikit-yb.org/en/latest/_images/radviz.png. Acesso em: 25 ago. 2019. SHNEIDERMAN, B. The eyes have it: a task by data type taxonomy for information visualizations. : In . Boulder: ACM, 1996. p. 336-343.Proceedings of IEEE Symposium on Visual Languages SPENCE, R. . New York: ACM Press, 2000.Information Visualization STHDA. , [201-]. Disponível em: Scatter Plot http://www.sthda.com/sthda/RDoc/figure/graphs/scatterplot- matrices-scatter-plot-matrices-1.png. Acesso em: 26 ago. 2019. WIKICIENCIAS. , [201-]. Disponível em: Matriz de adjacências https://i0.wp.com/wikiciencias.casadasciencias. org/wiki/images/c/cb/Matrizadjacencias.png. Acesso em: 26 ago. 2019. WIKIPEDIA. , [201-]. Disponível em: Andrews curve for Iris data https://upload.wikimedia.org/wikipedia /commons/thumb/0/03/Andrews_curve_for_Iris_data_set.png/360px-Andrews_curve_for_Iris_data_set.png. Acesso em: 27 ago. 2019. XCEPTICZP. Gráfico de barras verticais, também chamado de gráfico de colunas. Wikipedia - Selected .incarceration rates worldwide. The stats source is the World Prison Population List (6th edition) Disponível em: https://pt.wikipedia.org/wiki/Gr%C3%A1fico_de_barras#/media/Ficheiro: Incarceration_Rates_Worldwide_ZP.svg. Acesso em: 25 ago. 2019. https://www.scikit-yb.org/en/latest/_images/radviz.png https://www.scikit-yb.org/en/latest/_images/radviz.png https://www.scikit-yb.org/en/latest/_images/radviz.png https://www.scikit-yb.org/en/latest/_images/radviz.png http://www.sthda.com/sthda/RDoc/figure/graphs/scatterplot-matrices-scatter-plot-matrices-1.png http://www.sthda.com/sthda/RDoc/figure/graphs/scatterplot-matrices-scatter-plot-matrices-1.png http://www.sthda.com/sthda/RDoc/figure/graphs/scatterplot-matrices-scatter-plot-matrices-1.png https://i0.wp.com/wikiciencias.casadasciencias.org/wiki/images/c/cb/Matrizadjacencias.png https://i0.wp.com/wikiciencias.casadasciencias.org/wiki/images/c/cb/Matrizadjacencias.png https://i0.wp.com/wikiciencias.casadasciencias.org/wiki/images/c/cb/Matrizadjacencias.png https://upload.wikimedia.org/wikipedia/commons/thumb/0/03/Andrews_curve_for_Iris_data_set.png/360px-Andrews_curve_for_Iris_data_set.png https://upload.wikimedia.org/wikipedia/commons/thumb/0/03/Andrews_curve_for_Iris_data_set.png/360px-Andrews_curve_for_Iris_data_set.png https://upload.wikimedia.org/wikipedia/commons/thumb/0/03/Andrews_curve_for_Iris_data_set.png/360px-Andrews_curve_for_Iris_data_set.png https://pt.wikipedia.org/wiki/Gr%C3%A1fico_de_barras#/media/Ficheiro:Incarceration_Rates_Worldwide_ZP.svg https://pt.wikipedia.org/wiki/Gr%C3%A1fico_de_barras#/media/Ficheiro:Incarceration_Rates_Worldwide_ZP.svg https://pt.wikipedia.org/wiki/Gr%C3%A1fico_de_barras#/media/Ficheiro:Incarceration_Rates_Worldwide_ZP.svg Introdução 2.1 Pesquisa por ferramentas de dashboard para dados multimodais 2.2 Dashboard 2.2.1 Visualizações multidimensionais 2.2.2 Técnicas de projeção geométrica 2.2.3 Iconográficas 2.2.4 Orientadas a pixel 2.3 Visualização de dados em redes e hierárquicos 2.3.1 Treemap 2.3.2 Grafos 2.3.3 Pacotes e Ferramentas para visualização de dados Síntese Bibliografia
Compartilhar