Baixe o app para aproveitar ainda mais
Prévia do material em texto
de para Autora: www.knime.com & www.hupdata.com 2 Traduzindo a funcionalidade do Excel para o KNIME Analytics Platform Este guia ajudará a fazer a transição do Excel para o KNIME. Você encontrará as funções e técnicas do Excel mais comumente usadas e seus equivalentes KNIME, sendo guiado pelas etapas que você executaria no Excel e mostrando como elas podem ser feitas no KNIME Analytics Platform. Descubra, por exemplo, como fazer a leitura de dados, filtragem, classificação, dinamização, fórmulas matemáticas e funções comumente usadas, como vlookup. Nenhum conhecimento prévio de KNIME Analytics Platform é requerido. Copyright © 2021 by KNIME Press Todos os direitos reservados. Esta publicação é protegida por direitos autorais e a permissão deve ser obtida do editor antes de qualquer reprodução, armazenamento em um sistema de recuperação ou transmissão proibida de qualquer forma ou por qualquer meio, eletrônico, mecânico, fotocópia, gravação ou similares. Este livro foi atualizado para o KNIME 4.3. Para obter informações sobre permissões e vendas, escreva para: HupData Data Analysis Solutions KNIMEPress Avenida Paulista, 2028, 11º andar Technoparkstr. 1 01310-200, São Paulo – SP 8005 Zurich Brasil Switzeland contato@hupdata.com knimepress@knime.com mailto:contato@hupdata.com mailto:knimepress@knime.com www.knime.com & www.hupdata.com 3 Sumário Uso Geral ..................................................................................................................................................................................................................................................... 5 Planilhas | Workflows e Nodes ............................................................................................................................................................................................................................ 6 Pastas | Workspace .............................................................................................................................................................................................................................................. 7 O KNIME Workbench .................................................................................................................................................................................................................................................... 8 Construindo um KNIME Workflow ............................................................................................................................................................................................................................... 9 Display Exibição da Tabela de Dados ....................................................................................................................................................................................................................... 10 Entrada/Saída ............................................................................................................................................................................................................................................ 11 Abrindo um Arquivo de Excel | Node Excel Reader ........................................................................................................................................................................................... 12 Abrindo um Arquivo CSV ou txt | Node CSV Reader ........................................................................................................................................................................................ 13 Importando Conteúdos de Vários Arquivos do mesmo Tipo para uma Tabela Única........................................................................................................................................... 14 Importando Conteúdo de Várias Planilhas para uma Única Tabela ....................................................................................................................................................................... 15 Salvando uma arquivo de Excel | Node Excel Writer ....................................................................................................................................................................................... 16 Adicionando uma planilha a um arquivo Excel | Excel Writer Node ............................................................................................................................................................... 17 Tipos de dados em Excel | Data Types in KNIME ............................................................................................................................................................................................ 18 Conexão com Banco de Dados | Nodes Database Connector ........................................................................................................................................................................ 19 Dicas em Leitura de Dados com KNIME Analytics Platform .................................................................................................................................................................................... 20 Anexando/Juntando Dados ....................................................................................................................................................................................................................... 21 Anexando Dados | Node Concatenate ............................................................................................................................................................................................................... 22 VLOOKUP | Node Filter e Joiner ........................................................................................................................................................................................................................ 23 Filtragem, Transformação e Agregações ................................................................................................................................................................................................... 24 Filtrando/Removendo Linhas com um Valor Específico | Row Filter ............................................................................................................................................................. 25 Filtrando/Removendo Linhas com Valores Diferentes | Rule-based Row Filter ............................................................................................................................................. 26 www.knime.com & www.hupdata.com 4 Removendo Duplicatas | Duplicate Row Filter ................................................................................................................................................................................................. 27 Classificando Linhas por Múltiplas Colunas Chaves | Node Sorter ...............................................................................................................................................................28 Removendo Colunas | Node Column Filter ....................................................................................................................................................................................................... 29 Reordenando e renomeando colunas | Nodes Column Resorter e Column Rename .................................................................................................................................... 30 Alterando tipos de dados | String to Number e Number to String .................................................................................................................................................................. 31 Dicas em Manipulação de Dados com KNIME Analytics Platform .......................................................................................................................................................................... 32 Agregação de Dados .................................................................................................................................................................................................................................................. 33 Tabelas Dinâmicas | Node Pivoting .................................................................................................................................................................................................................. 34 Tabelas Dinâmicas sem Colunas | Node GroupBy .......................................................................................................................................................................................... 35 Transformar colunas em linhas | Node Unpivoting ......................................................................................................................................................................................... 36 Funções Matemáticas e Funções de Texto .............................................................................................................................................................................................................. 37 Funções Matemáticas | Node Math Formula ................................................................................................................................................................................................... 38 Funções Matemáticas | Node Math Formula ................................................................................................................................................................................................... 39 Concatenação e Localização/Substituição | Node String Manipulation ........................................................................................................................................................ 40 Formatando Tabelas do Excel .................................................................................................................................................................................................................... 41 Criando uma XLS Control Table com Valores Tag ................................................................................................................................................................................................... 44 Adicionar Ações de Formatação com Base em Valores Tag .................................................................................................................................................................................. 48 file:///C:/Users/marin/Documents/EBook_EXCEL_KNIME_Update2020_v2.docx%23_Toc69379506 www.knime.com & www.hupdata.com 5 Uso Geral www.knime.com & www.hupdata.com 6 Planilhas Workflows e Nodes Excel KNIME Analytics Platform O Microsoft Excel é um programa de planilhas, que apresenta ferramentas como cálculos, gráficos, tabelas dinâmicas e uma linguagem macro de programação (Visual Basic for Applications, VBA). Usando matemática celular, macros e VBAs, você pode editar uma planilha. Pode ser desde uma matemática celular bem simples, como somar os valores das células A1 e B1 (= SUM (A1, B1)), como também pode ser uma lógica incorporada mais complexa. KNIME Analytics Platform implementa programação visual. Isso significa que cada etapa da análise de dados é representada por meio de um bloco chamado node (nó) em um editor gráfico. Uma sequência de nodes conectados é chamada de workflow (fluxo de trabalho) sendo o conceito correspondente de uma planilha do Excel com muitas funções e/ou VBAs. Os dados são organizados por meio de tabelas de dados, onde cada célula de dados é identificada por um cabeçalho de coluna e um ID de linha. Para visualizar o conteúdo de uma tabela de dados, consulte a página 10. Nota. Os nodes têm quatro estados possíveis, exibidos por um pequeno semáforo sob o próprio node: - Não configurado -> luz vermelha - Configurado -> luz amarela - Executado com sucesso -> luz verde - Executado com erro -> luz vermelha com uma cruz Para mais detalhes sobre a Plataforma KNIME Analytics, clique em: - R. Silipo, “KNIME Beginner’s Luck”, KNIME Press, 2018 - R. Silipo, J. Prinz, “KNIME Advanced Luck”, KNIME Press, 2018 https://www.knime.com/knime-software https://www.knime.com/knimepress/beginners-luck https://www.knime.com/knimepress/knime-advanced-luck www.knime.com & www.hupdata.com 7 Pastas Workspace Excel KNIME Analytics Platform Os arquivos do Excel normalmente são salvos em pastas diferentes. Um único arquivo de Excel pode conter várias planilhas. A aba workspace (área de trabalho) define a pasta em que todos os workflows e dados são salvos. Um workflow corresponde a uma planilha do Excel com todas as fórmulas, visualizações e VBAs. Todos os projetos e conjuntos de dados salvos em uma workspace estão disponíveis no KNIME Explorer, localizado no canto superior esquerdo do KNIME workbench (ambiente de trabalho). O caminho para a workspace é selecionado logo no início, após a inicialização da KNIME Analytics Platform. Você ainda pode alterar o espaço de trabalho após o lançamento do KNIME, acessando “Arquivo” no menu superior e selecionando “Switch Workspace”. Você pode ter vários espaços de trabalho, por exemplo para diferentes projetos ou clientes. www.knime.com & www.hupdata.com 8 O KNIME Workbench Após baixar e instalar o KNIME Analytics Platform, você pode iniciar a partir da área de trabalho ou da pasta de instalação. O KNIME workbench, conforme imagem abaixo, é aberto e inclui os seguintes painéis: “KNIME Explorer” mostrando a lista de workflows e servidores KNIME disponíveis atualmente para o workspace selecionado e o mountpoint My-KNIME-Hub. “Workflow Coach” recomendando o próximo node com base nas estatísticas dos usuários do KNIME e o node atualmente selecionado no “Workflow Editor”. “Node Repository” contendo todos os nodes instaladosatualmente. Uma caixa “Search” está disponível na parte superior deste painel para a procura de nodes. “Workflow Editor” na parte central, permite a criação e edição de workflows. “Node Description” descrevendo a função e as definições de configuração para o node selecionado no “Workflow Editor” ou no painel de “Node Repository” “Node Monitor” mostrando uma prévia da tabela de saída do node selecionado no “Workflow Editor”. “KNIME Hub” permitindo o uso do KNIME Hub para pesquisar nodes, workflows, components e extensions. “Outline” oferecendo uma visão geral do workflow. “Console” mostrando mensagens de execução, por exemplo mensagens de erro e aviso. KNIME Explorer Workflow Coach Node Repository Workflow Editor Outline Console/Node Monitor Node Description Workflow Editor www.knime.com & www.hupdata.com 9 Construindo um KNIME Workflow Workflows KNIME são criados por arraste&solte de nodes vindos dos painéis “Node Repository” ou “Workflow Coach” para o “Workflow Editor”. Use a caixa de pesquisa na parte superior do Node Repository ou navegue pelos nodes classificados por categorias diferentes para encontrar o node correto para sua próxima etapa. Nodes são conectados uns aos outros por de suas portas de input e output. Basta clicar na porta de saída do primeiro node e soltar na porta de entrada do segundo node. Nodes que acabaram de ser criados mostram um status de luz vermelha: ainda não configurado. Para configurar um node, clique com o botão direito do mouse no node e selecione a opção “Configure” ou, alternativamente, clique duas vezes no node. A janela “Configuration” do node abre. Configure o node. Se a configuração for bem- sucedida, o status do muda para um semáforo amarelo. O node agora está configurado, mas ainda não foi executado.Para executar o node, clique com o botão direito do mouse no node e selecione a opção “Execute“. Se a execução for bem-sucedida, o node muda seu status para uma luz verde. Passo 1: Pesquise e crie um node por meio de arrastar&soltar Passo 2: Conecte os nodes Passo 3: Configure o node Passo 4: Execute o node Nota 1: Para criar um novo workflow vazio, clique com o botão direito no painel do KNIME Explorer, selecione “Create New KNIME Workflow e defina o nome e o destino do novo workflow na nova janela. Nota 2: lique na lupa ao lado da caixa de pesquisa no node para alterar o modo da caixa de pesquisa para uma pesquisa difusa. Isso torna mais fácil encontrar o node correto no início. Nota 3: O guia “Getting Started Guide” o orienta passo a passo na construção de seu primeiro workflow de exemplo. https://www.knime.com/getting-started-guide www.knime.com & www.hupdata.com 10 Display Exibição da Tabela de Dados Excel KNIME Analytics Platform No Excel, o que você vê é o que recebe. Isso significa que a tabela de dados que você vê é a tabela de dados final. As tabelas de dados de saída produzidas após a execução do node estão sempre disponíveis. - Click com o botão direito do mouse no node do workflow - Selecione a última opção no menu aberto Nota: alguns nodes como os de plotting e modeling, também tem uma função de "View" mais complexa. A opção que leva a essa "View" geralmente é exibida no meio do menu. Cabeçalho de colunas Tipo de dado www.knime.com & www.hupdata.com 11 Entrada/Saída www.knime.com & www.hupdata.com 12 Abrindo um Arquivo de Excel Node Excel Reader Excel KNIME Analytics Platform Para abrir um arquivo do Excel você pode clicar duas vezes no arquivo, ou abrir o Excel e ir em "Arquivo" no menu superior, selecionando "Abrir ..." e depois navegar até o arquivo que deseja abrir. O node Excel Reader lê uma única planilha de um arquivo Excel. Como no Excel, primeiramente, você precisa definir o caminho do arquivo. Em seguida, você pode selecionar a planilha. As opções de configuração adicionais permitem definir se a tabela possui cabeçalhos de coluna e/ou Row IDs, além de especificar qual parte da planilha você deseja ler. Nota: Para ler vários arquivos do Excel que têm os mesmos cabeçalhos de coluna e estão todos armazenados em uma pasta, selecione na parte Mode “Files in folder”. Isso lê todos os arquivos do Excel e os concatena, ou seja, os empilha uns sobre os outros. Caminho do arquivo Nome da Planilha Cabeçalho de colunas https://kni.me/n/c0pxSnhlDBhruvbi www.knime.com & www.hupdata.com 13 Abrindo um Arquivo CSV ou txt Node CSV Reader Excel KNIME Analytics Platform Para abrir um arquivo CSV, clique em "Arquivo" no menu superior e selecione "Importar". Selecione arquivo CSV e escolha o arquivo que deseja abrir. Preencha todas as opções necessárias, como o caractere de separação, para ler corretamente o arquivo. O node CSV Reader lê vários arquivos baseados em texto, por exemplo, Arquivos CSV. Na janela de configuração você pode definir todas as opções necessárias, como caractere de separação, para leitura correta do arquivo. Nota 1: Clique no botão “Autodetect format” caso o node não crie uma prévia. Nota 2: Verifique as guias adicionais para limitar o número de linhas ou para alterar a codificação. Caminho do arquivo Cabeçalho de coluna Delimitador https://kni.me/n/kquSunBXI2Vo6TJy www.knime.com & www.hupdata.com 14 Importando Conteúdos de Vários Arquivos do mesmo Tipo para uma Tabela Única Excel KNIME Analytics Platform Se você tiver uma pasta contendo vários arquivos do mesmo tipo (por exemplo, CSV), poderá abri-los todos ao mesmo tempo em diferentes instâncias do Excel. Siga as instruções da página anterior e selecione todos os arquivos que deseja abrir. Para mover tabelas de dados juntas em uma única planilha, você deve continuar manualmente usando copiar e colar. Nota: Antes de copiar e colar, verifique se todos os arquivos têm a mesma ordem de colunas. Muitos nodes de leitura no KNIME Analytics Platform suportam a leitura de vários arquivos em uma pasta e combiná-los em uma tabela. Por exemplo, o CSV Reader pode ler vários arquivos baseados em texto. Para ler vários arquivos, selecione o “Mode” “Files in folder” e especifique a pasta usando o botão “Browse”. Uma pequena nota informa quantos arquivos estão selecionados no momento. Caso não queira ler todos os arquivos de uma pasta, clique no botão “Filter options” para especificar quaisarquivos devem ser incluídos de acordo com sua extensão e/ou nome. Por último, você também pode incluir arquivos de subpastas ativando a caixa de seleção “Include subfolders”. Nota: Na aba “Transformation”, você pode definir se deseja usar a união ou a interseção das colunas das diferentes tabelas. Modo Filter Filtro União ou intersecção www.knime.com & www.hupdata.com 15 Importando Conteúdo de Várias Planilhas para uma Única Tabela Excel KNIME Analytics Platform Para mover dados de várias planilhas do Excel para uma planilha do Excel prossiga manualmente, usando copiar e colar. Nota: Antes de copiar e colar, verifique se todos os arquivos têm a mesma ordem de colunas. Com um simples loop, você pode ler todas as páginas de um arquivo de Excel automaticamente. O node Read Excel Sheet Names cria uma lista de todos os nomes de planilhas. O loop (a parte entre os nodes azuis) lê uma planilha do arquivo do Excel a cada iteração. Portanto, a cada iteração, o node Table Row to Variable Loop Start cria uma variável de fluxo com o nome da planilha como seu valor. Essa variável de fluxo é usada no node Excel Reader para controlar a seleção de planilha. O Loop End concatena o conteúdo das diferentes tabelas. Nota 1: Lesson 3 do curso gratuito KNIME Self-Paced Course L2-DW KNIME Analytics Platform for Data Wrangles course introduz variáveis de fluxo. Nota 2: Lesson 4 do curso gratuito KNIME Self-Paced Course L2-DW KNIME Analytics Platform for Data Wrangles introduz loops no KNIME. https://kni.me/n/pSZxsfdYwqHb7ecJ https://kni.me/n/q7loejCZ1HWH5hUr https://kni.me/n/I129Ntc6bhMN6EpL https://kni.me/n/AApA5VHd41CVDe7u https://kni.me/n/AApA5VHd41CVDe7u https://www.knime.com/knime-introductory-course/chapter7/section1 https://www.knime.com/knime-introductory-course/chapter7/section1 www.knime.com & www.hupdata.com 16 Salvando um arquivo de Excel Node Excel Writer Excel KNIME Analytics Platform Para salvar a planilha de um arquivo Excel, você tem diferentes opções: • Clique em Arquivo-> Salvar como ... e defina o local de saída • Ou pressione Shift + Ctrl + s e defina o local de saída O node Excel Writer grava a tabela de dados de entrada em uma planilha em um arquivo Excel, no formato xls ou xlsx. Na janela de configuração, você pode definir o local de saída e o nome da planilha. As opções de configuração adicionais permitem que você sobrescreva um arquivo existente e defina se deseja gravar os cabeçalhos de coluna/ids de linha na primeira linha/coluna de sua planilha do Excel. Nota 1: Para escrever várias tabelas em planilhas diferentes, você pode adicionar portas de entrada dinâmica (página 23) e definir um nome de folha para cada tabela de entrada. Local de Saída Nome da planilha Cabeçalho de colunas/linhas https://kni.me/n/W7ZrYokRTpEckCe2 www.knime.com & www.hupdata.com 17 Adicionando uma planilha a um arquivo Excel Excel Writer Node Excel KNIME Analytics Platform Para adicionar uma nova planilha a um arquivo Excel existente, você deve clicar no sinal de mais abaixo da tabela, ao lado das planilhas já existentes. Para adicionar uma tabela de outro arquivo Excel, você pode copiar e colar a tabela manualmente. O node Excel Writer também pode adicionar planilhas a um arquivo Excel existente. Na janela de configuração, você pode definir a localização do arquivo Excel existente e selecionar “append” para a opção de configuração “If exists”. Na parte “Sheets” você pode definir o novo nome da planilha e se o node deve sobrescrever ou falhar no caso de já existir uma planilha com o nome definido. Configurações da planilha Localização do arquivo existente Opção de anexo https://kni.me/n/W7ZrYokRTpEckCe2 www.knime.com & www.hupdata.com 18 Tipos de dados em Excel Data Types in KNIME Excel KNIME Analytics Platform A captura de tela ao lado mostra os diferentes tipos de dados disponíveis no Excel: Eles podem ser mapeados para os seguintes tipos de dados na KNIME Analytics Platform: Excel KNIME Analytics Platform General Number ou String Number Number Currency (e.g. 50,25 €) Number (Integer ou double) (e.g. 50,25) Accounting (e.g. 50,25 €) Number (Integer ou double) (e.g. 50,25) Short Date Local Date Long Date Local Date Time Local Time Percentage (e.g. 50%) Number (double) (e.g. 0,5) Fraction Number (double) Scientific (e.g. 5,00E+02) Integer (e.g. 500) O KNIME Analytics Platform suporta a leitura de todos os tipos de dados do Excel e ainda mais. Ao ler um arquivo, KNIME Analytics Platform tenta detectar automaticamente o tipo de dados correto. Se quiser mudar isso durante a leitura, você pode usar a aba Transformation do node Excel Reader. Nota 1: A aba Transformation também está disponível em outros nodes de leitura. Nota 2: Na aba Transformation você também pode renomear, remover e alterar a ordem das colunas. Nota 3: Para alterar o tipo de dados posteriormente no workflow você pode usar um dos seguintes nodes: String to Number, Number to String, ou Table Manipulator. https://kni.me/n/I129Ntc6bhMN6EpL https://kni.me/n/gXR6yic77CM35Zfx https://kni.me/n/s--Phzu0nUXeg0E9 https://kni.me/n/GV0dF7NgDOyLFMsK www.knime.com & www.hupdata.com 19 Conexão com Banco de Dados Nodes Database Connector Excel KNIME Analytics Platform Você pode se conectar a um banco de dados no Excel. Uma descrição sobre como fazer isso está disponível no seguinte link: http://www.erpsoftwareblog.com/2017/01/microsoft-excel-connections- sql-databases/ A leitura de dados de um banco de dados segue três etapas: conectar, selecionar e extrair. O workflow é construído passo a passo com os nodes Connector, DB Table Selector, e DB Reader. Nodes Database simplesmente criam a SQL query, eles não a executam. Apenas o node final, exemplo DB Reader, executa a SQL query e extrai os dados. Muitos conectores de banco de dados estão disponíveis para se conectar aos bancos de dados mais comumente usados. No entanto, o node DB Connector permite que você se conecte a todos os bancos de dados compatíveis com JDBC. Existem mais nodes de banco de dados que ajudam a construir a SQL query por processamento in-database. Você pode usá-los entre o DB Table Selector e o node DB Reader. http://www.erpsoftwareblog.com/2017/01/microsoft-excel-connections-sql-databases/ http://www.erpsoftwareblog.com/2017/01/microsoft-excel-connections-sql-databases/ https://kni.me/n/PEWSVICzt9HX-3cdhttps://kni.me/n/PEWSVICzt9HX-3cd https://kni.me/n/d8TQIqNnO3XRVTjQ https://kni.me/n/d8TQIqNnO3XRVTjQ https://kni.me/n/0oD8015Fv-UmISSY https://kni.me/n/0oD8015Fv-UmISSY https://kni.me/n/PEWSVICzt9HX-3cd https://kni.me/n/d8TQIqNnO3XRVTjQ https://kni.me/n/d8TQIqNnO3XRVTjQ www.knime.com & www.hupdata.com 20 Dicas em Leitura de Dados com KNIME Analytics Platform Todos os nodes de leitura requerem caminhos para o local do arquivo de entrada. Vamos analisar algumas dicas e truques para isso: Dica 1: Use o arraste&solte do KNIME Explorer: Os arquivos de dados salvos na pasta do workspace estão disponíveis no painel KNIME Explorer (canto superior esquerdo). Para ler um desses arquivos, basta arrastar e soltar um arquivo do painel KNIME Explorer para o editor de workflow. O KNIME cria automaticamente o node correto do leitor e define o caminho do local de entrada. Dica 2: Diferentes opções para definir caminhos de arquivos: No KNIME, temos opções diferentes para fornecer um caminho de arquivo. Isso se torna importante quando você começa a compartilhar seus workflows ou exportá-los para outras instalações da KNIME Analytics Platform ou KNIME Servers. Há 4 sistemas de arquivos padrão disponíveis em KNIME Analytics Platform. • Local File System: Permite que você selecione um arquivo/pasta em seu sistema local. • Mountpoint: Você pode se conectar a um KNIME Server ou o KNIME Hub via mountpoints adicionais no KNIME Explorer. Para ler os dados LOCAL ou outro mountpoint, selecione “Mountpoint“. Quando selecionado, um novo menu suspenso aparece para que você possa escolher o mountpoint. Mountpoints não conectados ficam acinzentados, mas ainda podem ser selecionados (observe que a navegação está desabilitada neste caso). Vá para KNIME Explorer e conecte-se ao mountpoint para habilitar a navegação. • Relative to: Permite que você escolha se deseja resolver o caminho relativo ao mountpoint, atual, workflow ou a área de dados do workflow atual. Quando selecionado, um novo menu suspenso aparece para escolher qual das três opções usar. • Custom/KNIME URL: Permite especificar um URL (exemplo file://, http:// ou knime://protocol). A navegação é desativada nesta opção. Dica 3: Reading from another file system: KNIME Analytics Platform permite que você se conecte e leia de muitas fontes/sistema de arquivos diferentes, por exemplo, Amazon S3, Microsoft SharePoint Online, Databricks, para citar apenas alguns. São necessárias três etapas (O guia de manuseio de arquivos fornece mais informações). Passo 1: Clique “...” no canto inferior esquerdo do ícone do node para adicionar uma porta de conexão do sistema de arquivos. Passo 2: Conecte-se ao sistema de arquivos desejado por meio do node conector dedicado e conecte com o node leitor. Passo 3: Selecione o arquivo/pasta no sistema de arquivos conectado. https://docs.knime.com/latest/analytics_platform_file_handling_guide/index.html www.knime.com & www.hupdata.com 21 Anexando/Juntando Dados www.knime.com & www.hupdata.com 22 Anexando Dados Node Concatenate Excel KNIME Analytics Platform Selecione manualmente a área que deseja anexar, copie e cole o conteúdo abaixo da primeira tabela. Nota 1: Antes de copiar e colar, verifique se todas as tabelas têm a mesma estrutura de coluna. O node Concatenate escreve duas ou mais tabelas, uma abaixo da outra. Nota 1: A ordem da coluna não precisa ser a mesma. Nota 2: Você pode decidir se deseja a interseção ou a união das colunas. Nota 3: O node Concatenate tem a opção de adicionar mais portas de entrada para concatenar mais de duas tabelas. Para adicionar uma porta de entrada adicional, clique nos três pontos na parte inferior esquerda do node e selecione “Add input port”. https://kni.me/n/0rhLXWO6OS1xMi8T https://kni.me/n/0rhLXWO6OS1xMi8T www.knime.com & www.hupdata.com 23 VLOOKUP Node Filter e Joiner Excel KNIME Analytics Platform A função VLOOKUP é usada para diferentes tarefas. Os usos mais comuns são: 1. Procurar um determinado valor, por exemplo, o preço de um determinado produto. 2. Associar colunas com base em uma chave primária (valor de pesquisa), por exemplo, juntar informações do produto com base no ID do produto. Uma função alternativa para a segunda tarefa é INDEX MATCH. 1. Procure um determinado valor, por exemplo, o preço de um determinado produto. Nota 1: Sua tabela original completa ainda está disponível na porta de saída do node Table Reader. Veja mais informações sobre os nodes Row Filter e Column Filter na páginas 22 e 25. 2. Unir colunas com base em uma coluna de junção, por exemplo, juntar informações do produto com base no ID do produto. Nota 1: Similarmente aos bancos de dados, diferentes modos de junção estão disponíveis: junção interna, externa esquerda, externa direita e externa completa. O modo de junção que corresponde ao VLOOKUP é a junção externa esquerda (valores ausentes, caso não haja correspondência no intervalo que contém o valor de consulta). Nota 2: A “Joining Column” é a coluna de pesquisa de valor. Filtrar Colunas Chave de Joining Columns Modo de Joining Mode https://kni.me/n/3OUoQi6aEdn90sL1 https://kni.me/n/jd2U-FYTI8jCbQls https://kni.me/n/PQwkdaHAJNa5PUtT www.knime.com & www.hupdata.com 24 Filtragem, Transformação e Agregações www.knime.com & www.hupdata.com 25 Filtrando/Removendo Linhas com um Valor Específico Row Filter Excel KNIME Analytics Platform Para filtrar os dados, selecione uma célula aleatória na tabela de dados, vá para a guia Início, clique no botão “Classificar e filtrar” e selecione “Filtro”. Selecione o valor de seu interesse no menu suspenso. Para remover linhas, selecione as linhas que deseja excluir, clique com o botão direito do mouse e selecione “Excluir linhas”. No KNIME Analytics Platform não há diferença entre filtrar e remover linhas, pois a tabela original não é excluída e ainda está disponível na porta de saída do node anterior. Nota 1: Se você estiver interessado apenas nas linhas com um valor específico, poderá usar o node Row Filter. Nota 2: Se você deseja incluir linhas com base em valores diferentes, pode usar o node Rule-based Row Filter (Veja a próxima página). Nota 3: À direita, você pode escolher se deseja incluir ou excluir as linhas com o valor correspondente. Nota 4: Outras opções de filtro estão disponíveis,por exemplo, em um intervalo numérico, filtrar as linhas por número, ID da linha ou apenas pelos valores ausentes. Filtrar Colunas Valor a manter ou excluir https://kni.me/n/jd2U-FYTI8jCbQls https://kni.me/n/Q-yW-3C9DumtInuz www.knime.com & www.hupdata.com 26 Filtrando/Removendo Linhas com Valores Diferentes Rule-based Row Filter Excel KNIME Analytics Platform Para filtrar os dados, selecione uma célula aleatória nas tabelas de dados, clique em " Sort& Filter" e selecione "Filter". Selecione os valores de seu interesse no menu suspenso. Para remover linhas, selecione as linhas que deseja excluir, clique com o botão direito do mouse e escolha "Excluir linhas". No KNIME Analytics Platform não há diferença entre filtrar e remover linhas, pois a tabela original não é excluída e ainda está disponível na porta de saída do node anterior. Nota 1: Na parte inferior da janela de configuração, você pode escolher se deseja incluir ou excluir correspondências VERDADEIRAS. Nota 2: O node Rule-based Row Filter ” possui várias funções diferentes para muitas opções avançadas de filtro. Nota 3: Linhas diferentes no quadro de expressão funcionam como uma conjunção OR. Lista de Funções Lista de Colunas Expressão https://kni.me/n/Q-yW-3C9DumtInuz www.knime.com & www.hupdata.com 27 Removendo Duplicatas Duplicate Row Filter Excel KNIME Analytics Platform Para remover duplicatas • Selecione o intervalo de células que podem ter duplicatas que você deseja remover. • Vá para a guia Dados e selecione “Remover Duplicatas” • Selecione as colunas para detecção de duplicatas e clique “OK” O node Duplicate Row Filter detecta e trata duplicatas. O tratamento padrão remove linhas duplicadas como no Excel. A coluna no quadro “Include” corresponde à coluna selecionada para detecção de duplicatas no Excel. Isso significa que as linhas com os mesmos valores nessas colunas são detectadas como duplicatas. Nota 1: Na aba “Advanced”, você pode alterar o tratamento de duplicatas, por exemplo, para manter linhas duplicadas e adicionar uma coluna mostrando quais das linhas são únicas, escolhidas ou duplicadas. https://kni.me/n/SQUECT-F0VhUjdbf www.knime.com & www.hupdata.com 28 Classificando Linhas por Múltiplas Colunas Chaves Node Sorter Excel KNIME Analytics Platform Para classificar linhas por várias colunas, selecione as colunas pelas quais deseja classificar. Em seguida, clique em Classificar e filtrar e selecione "Classificação personalizada". Com o node Sorter, você pode classificar por uma ou mais colunas, tanto em ordem crescente quanto decrescente. Nota 1: Você pode adicionar quantas colunas-chave quiser clicando no botão “new columns”. Nota 2: Você pode classificar temporariamente a tabela de saída de um node. Clique no cabeçalho da coluna com base no qual deseja classificar e selecione se deseja classificar de forma crescente ou decrescente. https://kni.me/n/gwwIZ5c5EYsJErci www.knime.com & www.hupdata.com 29 Removendo Colunas Node Column Filter Excel KNIME Analytics Platform Para remover colunas, basta selecionar e excluir as colunas supérfluas. Lembre-se: Se você remover uma coluna usada em um campo de cálculo, quebrará a sua fórmula. Como o node Column Filter você pode excluir colunas supérfluas. Lembre-se de que a tabela de dados completa ainda estará disponível na porta de saída do node anterior para cálculos executados posteriormente. Nota 1: Você pode usar os botões de seta no meio para mover colunas do quadro “Include” para o quadro “Exclude” e vice-versa. Nota 2: Você pode usar o Wildcard/Regex Selection para remover colunas automaticamente por um padrão de nome. Nota 3: você pode usar a “Type Selection” para remover automaticamente colunas por tipo de dados. https://kni.me/n/DOkyMaii62U05xZ1 www.knime.com & www.hupdata.com 30 Reordenando e renomeando colunas Nodes Column Resorter e Column Rename Excel KNIME Analytics Platform Para reorganizer colunas: • Selecione o cabeçalho da coluna que você deseja mover • Pressione ctrl + shift + seta para baixo • Clique e segure o contorno verde da coluna que você deseja mover • Arraste sua coluna para a posição desejada Para renomear uma coluna, basta clicar na célula da coluna e alterar o valor da célula. Defina a ordem desejada das colunas, selecionando a que você deseja mover e usando os botões “Actions” à direita. Clique duas vezes na coluna que deseja renomear, ative a caixa de seleção “Change” e defina o cabeçalho da coluna na caixa de texto. www.knime.com & www.hupdata.com 31 Alterando tipos de dados String to Number e Number to String Excel KNIME Analytics Platform Para alterar o tipo de dados de uma coluna ou célula, selecione-o e vá para a guia Início. Em seguida, use o menu suspenso no meio. Para mudar os tipos de dados de uma coluna, você pode usar o node String to Number ou o node Number to String. Nota 1: No nodes String to Number você pode escolher entre diferentes tipos numéricos, por exemplo Double, Integer, e Long. https://kni.me/n/gXR6yic77CM35Zfx https://kni.me/n/gXR6yic77CM35Zfx https://kni.me/n/s--Phzu0nUXeg0E9 https://kni.me/n/gXR6yic77CM35Zfx www.knime.com & www.hupdata.com 32 Dicas em Manipulação de Dados com KNIME Analytics Platform Organize Colunas Remova Colunas Renomeie Colunas Mude o Tipo de Dados O node Table Manipulator permite que você execute muitas das transformações descritas em um node. Você pode usá-lo para: • Concatene várias tabelas (depois de adicionar portas de entrada dinâmicas clicando em “...” no canto inferior esquerdo do node) • Filtrar, organizar e renomear colunas • Altere o tipo de dados da coluna https://kni.me/n/GV0dF7NgDOyLFMsK www.knime.com & www.hupdata.com33 Agregação de Dados www.knime.com & www.hupdata.com 34 Tabelas Dinâmicas Node Pivoting Excel KNIME Analytics Platform Para criar uma tabela dinâmica no Excel • Clique em qualquer célula dentro do conjunto de dados • Vá para a guia Inserir e clique em Tabela dinâmica (Pivot Table) • Selecionar tabela/faixa e local de saída • Escolha os campos da tabela dinâmica arrastando-os para “Colunas”, “Linhas” e “Valores”. O node Pivoting é configurado através de três guias: • “Groups” define as colunas do grupo, também conhecidas como colunas “Rows” no quadro no Excel (IDs da linha final) • “Pivots” define as colunas dinâmicas, também conhecidas como colunas “Columns” no quadro Excel (cabeçalhos das colunas finais) • “Manual Aggregation” define as variáveis de agregação e os métodos de agregação A opção de configuração “Value” corresponde à aba “Manual Aggregation”. O node Pivoting produz três tabelas de saída: a tabela dinâmica e os valores totais para colunas e linhas. Nota 1: O node Pivoting não tem opção de filtro “Filter”, mas você pode usar simplesmente um node Row Filter anteriormente. Nota 2: No KNIME, você deve escolher pelo menos uma coluna para os Groups e Pivots. Caso deseje escolher apenas "Linhas", você pode usar o node GroupBy Linhas Colunas Valores https://kni.me/n/ebLbPp7VLbV4apta https://kni.me/n/ebLbPp7VLbV4apta https://kni.me/n/ebLbPp7VLbV4apta www.knime.com & www.hupdata.com 35 Tabelas Dinâmicas sem Colunas Node GroupBy Excel KNIME Analytics Platform Crie uma tabela dinâmica conforme descrito na página anterior e arraste apenas as colunas para os quadros "Linhas" e "Valores". O node GroupBy é configurado através de duas guias: • “Groups” define as colunas do grupo, também conhecidas como colunas “Rows” no quadro do Excel (IDs da linha final) • “Manual Aggregation” define as variáveis de agregação e os métodos de agregação A opção de configuração “Value” corresponde à guia “Manual Aggregation”. Linhas Colunas https://kni.me/n/5stmXk6zY_ORA4bC www.knime.com & www.hupdata.com 36 Transformar colunas em linhas Node Unpivoting Excel KNIME Analytics Platform Para criar uma tabela transformada de colunas em linhas • Armazene o conjunto de dados em uma tabela. • Selecione qualquer célula da tabela. • Clique na guia “Dados” e selecione “De Tabela/Intervalo”. • Isto abre o “Power Query Editor”. Selecione as colunas a serem transformadas, mantendo pressionada a tecla shift. • Clique na guia “Transformar” do Power Query Editor e selecione “Transformar Colunas em Linhas”. • Clique na guia “Página Inicial” do “Power Query Editor”, e selecione “Fechar e Carregar” para salvar os dados não dinamizados de volta na pasta de trabalho do Excel. Nota 1: O comando de transformação de colunas em linhas está disponível sem nenhum download adicional no Excel 2016 para Windows. Se você estiver usando uma versão diferente, pode ser necessário primeiro baixar o suplemento gratuito do Power Query no site da Microsoft. A criação no Power Query Editor ainda não é compatível com Mac. O node Unpivoting é configurado por meio de uma guia: • Na seção superior, “Value columns” define a coluna(s) a não dinamizar, também conhecida como seleção de coluna no Excel. • Na seção inferior, “Retained columns” define a coluna(s) que permanece(m) inalterada(s), também conhecida como colunas não selecionada no Excel. Nota 1: O node Unpivoting requer a seleção de pelo menos uma coluna na seção “Value columns”. https://kni.me/n/OrsWDmrgrJ2VEX6h https://kni.me/n/OrsWDmrgrJ2VEX6h www.knime.com & www.hupdata.com 37 Funções Matemáticas e Funções de Texto www.knime.com & www.hupdata.com 38 Funções Matemáticas Node Math Formula Excel KNIME Analytics Platform Aqui está uma lista de fórmulas matemáticas usadas com frequência no Excel. Você encontrará uma tradução para as fórmulas KNIME na próxima página: • SUM • AVERAGE • MEDIAN • SUMPRODUCT • ABS • SUMIF • Round functions o ROUND o ROUNDUP o ROUNDDOWN O node Math Formula possui uma longa lista de funções. A tabela na próxima página fornece uma tradução das funções do Excel mais usadas. Nota 1: Você pode decidir se deseja acrescentar uma nova coluna ou substituir uma das colunas, usando as caixas de seleção abaixo do quadro “Expression”. Nota 2: Ativando a caixa de seleção “Convert to Int”, você pode garantir que a coluna anexada/substituída de saída seja do tipo Inteiro. Nota 3: Para realizar a mesma expressão matemática em várias colunas, você pode usar o node Math Formula (Multi Column). Colunas Funcões Expressão https://kni.me/n/2fI5rIsFDCFPHc0R www.knime.com & www.hupdata.com 39 Funções Matemáticas Node Math Formula Excel KNIME Analytics Platform SOMA(número1;número2;…) COL_SUM(Col) = Soma dos valores na coluna selecionada. Col1 + Col2. = Soma dos valores em Col1 e os valores em Col2 para cada fila. MÉDIA(número1;número2;…) COL_MEAN(col_name) = Média dos valores na coluna selecionada. average(Col1, Col2,…) = Média dos valores das colunas selecionadas para cada fila. MED(número1;número2;…) COL_MEDIAN(Col_name) = Mediana dos valores na coluna selecionada. Median(Col1, Col2,…) = Mediana dos valores das colunas selecionadas para cada linha. SOMASPRODUTO(número1;número2;…) Sequência de dois node “Math Formula”: Primeiro: Multiplique as duas colunas usando a expressão Col1 * Col2 e adicione uma nova coluna. Segundo: Use COL_SUM na nova coluna. ABS(número1) abs(Col) = O valor absoluto para todos os valores na coluna selecionada SOMASE(intervalo; critério) Sequência de dois nodes “Math Formula”: Primeiro: Anexar nova coluna com if(critéria, coluna a somar ,0) Segundo: Use COL_SUM na nova coluna. Funções de arredondamento: ARRED(número1, num_dígitos) ARREDONDAR.PARA.CIMA (número1, num_dígitos) ARREDONDAR.PARA.BAIXO (number1, num_dígitos) round(Col, NumberOf Digits) = O número de dígitos é opcional. ceil(Col*10^(num_digits))/10^num_digits. floor(Col*10^(num_digits))/10^num_digits. www.knime.com & www.hupdata.com40 Concatenação e Localização/Substituição Node String Manipulation Excel KNIME Analytics Platform 1. A função CONCATENAR (texto1, texto2, ...) combina textos diferentes em uma célula. 2. Para encontrar e substituir um determinado valor, você deve ir para "Editar -> Localizar -> Substituir…” para abrir a caixa de diálogo abaixo. Na caixa de diálogo exibida, você pode definir o valor que deseja substituir e o para qual valor deseja substituir. Com node String Manipulation, você pode manipular colunas do tipo String. Por isso, muitas funções diferentes estão disponíveis. 1. CONCATENAR (texto1, texto2,..) do Excel join(col1, col2 ,…) ou join(col1, “sua própria string”,…) Nota 1: Você pode associar os valores de diferentes colunas em linhas ou adicionar outro valor de String a uma coluna. 2. Localização/Substituição Replace(string, search, replace) Nota 1: String é o valor de String onde você deseja substituir algo. Pode ser uma coluna para aplicar a linha de substituição ou um valor fixo da string. Nota 2: Para realizar a mesma manipulação em múltiplas colunas de string, você pode usar o node String Manipulation (Multi Column) https://kni.me/n/eOn8ibZnxIkY7XhT www.knime.com & www.hupdata.com 41 Formatando Tabelas do Excel www.knime.com & www.hupdata.com 42 No capítulo 1, apresentamos o Excel Writer, que você pode usar para escrever sua tabela de resultados em uma planilha do Excel. Por padrão, esta é uma tabela simples, sem qualquer formatação, como cores, células de borda, etc. Neste capítulo, queremos mostrar como usar os formatação XLS da extensão da comunidade Continental Nodes for KNIME. Esses nodes permitem adicionar instruções de formatação e configurações avançadas a arquivos XLS já existentes, para que você possa criar relatórios do Excel com a aparência que você costumava ter. Figura 1. À esquerda você pode ver uma tabela do Excel criada por um node Excel Writer e à direita uma tabela estilizada depois que as informações de formatação foram adicionadas com os nodes XLS Formatter nodes, por exemplo, fundo amarelo para os cabeçalhos. A chave para sua planilha Excel formatada é uma XLS Control Table adicional do mesmo tamanho que o arquivo original com um ou mais valores de tag separados por vírgula, por exemplo, cabeçalho, borda etc. Diferentes nodes XLS Formatter atribuem diferentes instruções de formatação às células com base nessas marcas, por exemplo, você pode alterar a cor de fundo de todas as células marcadas como “cabeçalho”. Sua formatação pode então ser aplicada a uma planilha Excel já existente com o node XLS Formatter (apply) . Dica: use uma conexão de variável de fluxo para certificar-se de que os arquivos do Excel já foram gravados. https://kni.me/n/W7ZrYokRTpEckCe2 https://kni.me/e/JPEQiK3qwxAJb5tU https://kni.me/n/W7ZrYokRTpEckCe2 https://kni.me/n/Fe_0B4pRQz5dFpWD www.knime.com & www.hupdata.com 43 Para resumir, isso significa que temos que realizar as seguintes etapas: 1. Escreva a tabela em uma planilha do Excel 2. Crie um XLS Control Table com valores de tag 3. Adicione instruções de formatação com base em valores de tag 4. Aplique as instruções de formatação à planilha Excel existente Figure 2. No canto inferior esquerdo, você pode ver uma tabela de controle com valores de tag, que é a chave para sua tabela estilizada. Com base nos valores de tag, os nodes XLS formatting amarelos coletam instruções de formatação, que são aplicadas pelo node XLS Formatter (apply), produzindo a tabela estilizada (canto superior direito). https://kni.me/n/Fe_0B4pRQz5dFpWD www.knime.com & www.hupdata.com 44 Este capítulo é dividido em duas partes. A primeira seção deste capítulo mostra duas maneiras de criar uma Tabela de controle XLS com tags. A segunda seção apresenta alguns dos nodes disponíveis para adicionar instruções de formatação. Dica: você não consegue encontrar os nodes em seu repositório de nodes? O Continental Nodes for KNIME são uma extensão da comunidade que você pode instalar arrastando a extensão do KNIME Hub para KNIME Analytics Platform ou instalando a extensão conforme descrito neste video. Criando uma XLS Control Table com Valores Tag Como diz o ditado, muitos caminhos levam a Roma. Esta seção apresenta duas estradas ou abordagens diferentes para a criação de um XLS Control Table. (Acontece que a segunda abordagem é minha favorita!) O “node chave” em ambos os exemplos é o node XLS Control Table Generator. Figure 3 A caixa de diálogo de configuração para o node XLS Control Table Generator https://kni.me/e/JPEQiK3qwxAJb5tU https://kni.me/e/JPEQiK3qwxAJb5tU https://youtu.be/8HMx3mjJXiw https://kni.me/n/3CKI1CYLcvcoiDto https://kni.me/n/3CKI1CYLcvcoiDto www.knime.com & www.hupdata.com 45 Figure 4. Aqui você pode ver outra opção para criar uma tabela de controle usando uma combinação de, onde o node Rule Engine é usado para definir valores de tag com base no número de linha e coluna. Abordagem 1: Table Creator + XLS Control Table Generator A primeira abordagem para criar um XLS Control Table com guias envolve uma combinação de um Table Creator e um node XLS Control Table Generator. Esta é uma abordagem fácil, porém a desvantagem é que envolve muito trabalho manual para criar a tabela de tags e você tem o problema de que a tabela de tags é estática. Portanto, esta abordagem só é recomendada para tabelas pequenas, onde o número de linhas e colunas não mudam. Abra a janela de configuração do node Table Creator para adicionar um ou vários valores de tag para cada célula. Se você quiser inserir várias tags, lembre-se de separá-las com uma vírgula. O node XLS Control Table Generator transforma a tabela em um XLS Control Table e substitui os nomes das colunas por letras e os IDs de linha por números. A caixa de seleção “write column header to first row” oferece a opção de reter os cabeçalhos das colunas, semelhante à opção “add column headers” no node Excel Writer. Aqui você pode ver uma opção para criar uma tabela de controle usando o node Table Creator e o node XLS Control Table Generator node Abordagem 2: XLS Control Table Generator + Rule Engine A segunda abordagem que queremos mostrar usa a combinação de dois nodes XLS Control Table Generator com a opção de “unpivot” ativada e o node Rule Engine. Ative a caixa de seleção “unpivot result table” na janela de configuração do primeiro node XLS Control Table Generator para gerar uma tabela que tem uma linha para cada célula na tabela de entrada, incluindo o valor, o número da linha, o cabeçalho da coluna e muito mais. https://kni.me/n/zpGPAjDyExkFL2HB https://kni.me/n/zpGPAjDyExkFL2HB https://kni.me/n/GRcZcBmlgMJ0lCBx https://kni.me/n/3CKI1CYLcvcoiDto https://kni.me/n/3CKI1CYLcvcoiDtohttps://kni.me/n/GRcZcBmlgMJ0lCBx https://kni.me/n/3CKI1CYLcvcoiDto https://kni.me/n/3CKI1CYLcvcoiDto https://kni.me/n/W7ZrYokRTpEckCe2 https://kni.me/n/GRcZcBmlgMJ0lCBx https://kni.me/n/3CKI1CYLcvcoiDto https://kni.me/n/3CKI1CYLcvcoiDto https://kni.me/n/zpGPAjDyExkFL2HB https://kni.me/n/3CKI1CYLcvcoiDto www.knime.com & www.hupdata.com 46 Figure 5. Aqui você pode ver a tabela resultante ao ativar a caixa de seleção “unpivot result table” no node XLS Control Table Generator. O node cria uma linha para cada célula, incluindo valor, número da linha, cabeçalho da coluna, etc. Esta tabela é uma ótima base para transformar valores em tags com o node Rule Engine. Por exemplo, podemos substituir todos os valores na primeira linha pela tag “cabeçalho”, ou substituir todos os valores na primeira coluna que têm um número de linha superior a 3 três pelo valor da tag “cw”. Dica: Ative o checkbox “Replace Column” e selecione a coluna “Value”. https://kni.me/n/3CKI1CYLcvcoiDto https://kni.me/n/zpGPAjDyExkFL2HB www.knime.com & www.hupdata.com 47 Figure 6. À esquerda está a caixa de diálogo de configuração do node Rule Engine node. Na seção Expression você pode ver as regras definidas para substituir os valores originais por tags, com base no número da linha e da coluna. À esquerda você pode ver a tabela de saída onde as regras são aplicadas e os valores são substituídos por diferentes tags Um segundo node XLS Control Table Generator pode transformar essa tabela de volta em sua forma original, onde os valores são substituídos por uma tag diferente. Este recurso é ativado automaticamente quando o node detecta uma tabela de entrada que foi criada por um node XLS Control Table Generator no modo não dinâmico. Essa abordagem envolve muito menos trabalho manual em comparação com a primeira abordagem e pode ser implementada de forma a lidar com a alteração das dimensões da tabela de maneira harmoniosa. Dica 1: Se você deseja escrever várias tabelas com especificações variáveis de tabelas abaixo umas das outras, você pode criar para cada tabela um XLS Control Table and e concatená-las posteriormente. Dica 2: Outro node útil para criar XLS Control Tables estáticas é o node XLS Control Table from Cell Range. https://kni.me/n/zpGPAjDyExkFL2HB https://kni.me/n/3CKI1CYLcvcoiDto https://kni.me/n/3CKI1CYLcvcoiDto https://kni.me/n/iKXVeDBk6bs19s6t https://kni.me/n/iKXVeDBk6bs19s6t www.knime.com & www.hupdata.com 48 Adicionar Ações de Formatação com Base em Valores Tag A próxima etapa para adicionar cores de fundo ou uma borda, etc. à sua tabela é uma sequência de nodes XLS Formatting, semelhante ao fluxo de trabalho na figura 2. Como você pode ver, todos os nodes no workflow de exemplo têm duas portas de entrada e uma porta de saída: • uma porta de entrada de dados • uma porta de entrada do XLS Formatter opcional (quadrado com borda verde) • uma porta de saída, que é uma porta do XLS “Formatter port” O quadrado verde é um tipo de porta especial da extensão, que coleta as diferentes instruções de formatação. A porta de entrada de dados espera a tabela com os valores do tag. A porta de entrada opcional pode ser usada para alimentar uma tabela “XLS Formatting” com instruções de formatação anteriores às quais as instruções do node devem ser adicionadas. A figura à direita mostra uma visão geral de todos os nodes na extensão Continental. Apresentarei meus favoritos e deixarei que você explore os outros. https://hub.knime.com/search?q=XLS%20Formatting&type=Node www.knime.com & www.hupdata.com 49 O node XLS Background Colorizer altera a cor de plano de fundo das células. Você pode atribuir uma cor estática e/ou preenchimento de padrão. Uma opção é atribuir a mesma cor a todas as células com um valor de tag específico, por exemplo, todas as células com a tag “cabeçalho” devem ter um fundo amarelo. Outra opção é usar os valores RGB na sintaxe hexadecimal #FFD800 ou na sintaxe decimal R/G/B como tags e usá-los como cor de fundo. O node XLS Conditional Formatter altera o plano de fundo das células com um determinado valor de tag de acordo com seu valor numérico. Na janela de configuração, você pode definir uma escala de cores definindo um valor mínimo e máximo e atribuindo uma cor a cada um. Opcionalmente, você pode definir um valor de ponto médio e atribuir uma cor a ele. As células com valores maiores ou menores do que os limites terão a cor de fundo do valor mínimo/máximo. O node XLS Border Formatter pode adicionar bordas a um determinado intervalo especificado por uma determinada marca ou por todas as marcas. Ao ativar as caixas de seleção correspondentes, você pode adicionar bordas à parte superior, direita, inferior e esquerda. Além de adicionar uma borda ao redor do intervalo especificado pelas marcas, o node também oferece a opção de usar linhas de contorno internas verticais e horizontais em cada célula. O node XLS Sheet Selector e o node XLS Merger são nodes realmente úteis se o seu arquivo EXCEL tiver mais de uma planilha. Por padrão, a formatação é sempre aplicada à primeira planilha. Portanto, se você tiver um arquivo Excel com apenas uma planilha, não precisa se preocupar com esses dois nodes. No entanto, se você tiver várias planilhas, o XLS Sheet Selector permite que você defina para qual planilha sua tabela de controle XLS se destina. https://kni.me/n/XZUCqIiZClqQ7xA6 https://kni.me/n/5D11wVeDqwF8ENO0 https://kni.me/n/IT93ruaKtrVXOism https://kni.me/n/EKWXQwefWkJF0us8 https://kni.me/n/U2vnoPRJLtb9WPYx https://kni.me/n/EKWXQwefWkJF0us8 www.knime.com & www.hupdata.com 50 O node XLS Cell Merger mescla as células para determinados intervalos retangulares de tags de entrada em uma célula. Por exemplo, podemos mesclar todas as células na primeira linha e centralizar o título com o node XLS Font Formatter. Este node funciona apenas em intervalos estritamente retangulares. O valor da célula mesclada é o valor da célula superior esquerda do intervalo mesclado. O node XLS Format Merger permite combinar instruções de formatação para diferentes planilhas antes de usar o node XLS Formatter (apply) ou quando aplicado à mesma planilha, ele mescla as propriedades no nível de detalhe mais baixo (por exemplo, as instruções de formatação para a célula A1 está em negrito na tabela de controle um e itálico na tabela de controle 2. A instrução de formatação subsequente para A1 está em itálico e negrito). Desse modo, a porta de entrada superior substitui uma inferior em caso de informações conflitantes (por exemplo, duas cores de fonte diferentes para a mesma célula). O node XLS Formatter (apply) lê um arquivo Excel não formatado, aplica todas as instruções de formatação coletadas e salva o arquivo Excel no local de saídadefinido. Esta foi uma breve introdução. Você pode encontrar mais informações sobre os diferentes node XLS Formatter nodes na extensão Continental na documentação https://www.knime.com/community/continental-nodes-for- knime-xls-formatter ou, de dentro da KNIME Analytics Platform, por olhando na descrição do node de cada node individualmente. https://kni.me/n/U2vnoPRJLtb9WPYx https://kni.me/n/yhUmnWUkmZj9JXhJ https://kni.me/n/Fe_0B4pRQz5dFpWD https://kni.me/n/Fe_0B4pRQz5dFpWD https://www.knime.com/community/continental-nodes-for-knime-xls-formatter https://www.knime.com/community/continental-nodes-for-knime-xls-formatter www.knime.com & www.hupdata.com 51 Livreto KNIME para usuários do Excel Você é um usuário experiente do Excel e deseja começar a usar a Plataforma KNIME Analytics? Às vezes, é difícil mudar de uma ferramenta ou de um software para outro. Mas este livreto é o ponto de partida perfeito, pois mapeia as funções e técnicas do Excel mais comumente usadas para seus equivalentes no KNIME. Descubra, por exemplo, como a leitura, filtragem, classificação e visualização de dados funcionam no KNIME. Para uma introdução completa ao KNIME, consulte o livro "KNIME Beginner's Luck", disponível no website do KNIME Press, click em: https://www.knime.com/knimepress Sobre a autora Kathrin Melcher é atualmente cientista de dados no KNIME. É mestre em Matemática pela Universidade de Konstanz, Alemanha. Ela ingressou na equipe KNIME como Evangelista em maio de 2017 e tem um forte interesse em ciência de dados, machine learning e algoritmos. Ela ama ensinar e compartilhar seu conhecimento sobre esses tópicos. https://www.knime.com/knimepress www.knime.com & www.hupdata.com 52 Livreto KNIME para usuários do Excel A HupData é uma empresa que oferece uma plataforma e serviços para Data Science e Machine Learning. Nossa missão é empoderar as pessoas a tomarem decisões estratégicas para seus negócios, baseadas em Data Analytics. Como Elite Partner do KNIME, uma de nossas missões é trazer ao Brasil os melhores e mais atuais conteúdos sobre KNIME, difuldindo e democratizando processos de Analytics. Para mais conteúdos sobre KNIME e informações sobre eventos e cursos feitos pela HupData, click em: https://hupdata.com/academy/ ou entre com contato por contato@hupdata.com Tradução: Marina Soares de Souza, Data Analyst Revisão: Gustavo Pereira Bruno, Data Analyst https://hupdata.com/academy/ mailto:contato@hupdata.com
Compartilhar