如何用KNIME生成报表

1.背景

KNIME的报表设计基于BIRT(Bussiness Intelligence Reporting Tool),这两种工具在同一个平台内可以共同协作,对于每个工作流,可以通过生成报告按钮直接进入report界面进行报表设计。

在KNIME中,我们建立workflow进行数据操作,生成数据和结果,而BIRT可以用这些内容生成报表。每次在workflow中修改后,BIRT会进行自动更新。

通常报表只需要对数据分析中的一部分结论进行展示,KNIME 的Report功能的好处在于,可以分别将这些信息接入BIRT,并进行报表设计。

2.从Workflow到Report

一个workflow只能与一个报表相连接,我们可以通过workflow界面上的“Report”icon进入BIRT环境,此时我们打开的是与当前所在workflow相连接的report。

本篇的report采用如图所示的workflow,将分析得出的统计图和统计表展示在报表中。

用KNIME制作报表流程

2.1 Report designer拓展模块的安装

上次介绍了KNIME的几大基础模块,然而在基础模块中不包含报表工具。上篇也提到了KNIME有Extension功能,而Report designer的功能即可通过这个功能进行下载安装。具体的方法是“File”→“Install KNIME extention”,搜索Report designer并且进行安装。

安装拓展模块

安装完成后,在Node Repository栏目中就会多一个模块——Reporting,下面包含两个节点,分别是Data to Report和Image to Report。二者的区别会在下文中提到。

2.2 KNIME 中的BIRT环境

搭建完workflow后,点击图中所示'Report' icon,就会打开新的Report编辑页面。

编辑栏
编辑栏

在这个界面中可以完成报表的结构设计,添加或修改文字、图片、表格等多种内容。界面共分为以下几个部分——KNIME Workflows,Data Set View,Report Items,Report Editor,Layout/Master Page。其中在workflow中添加了Reporting节点的数据集会出现在Data Set View,也就是报表中的数据来源;Report Items中是组成报表的元素类型;Report Editor是报表排版操作界面,在这里可以看到报表视图大纲(不是真实报表);Layout/Master Page中可以进行Report,Grid,Item等不同级别的报表内容设置。

报表制作环境

3.数据准备

3.1 Report中的数据来源

在report中呈现的内容可以有两种来源,一种是workflow中已经生成的image,不需要再进行修改可以直接用于report;另一种是workflow中已经进行过数据处理,想要呈现在报表中的是需要再加工的图形或表格(再加工是指对图表进行双轴、聚合等设置,或者在表格中进行指标计算等)。

以上两种情况分别对应于Reporting模块中的两个节点,使用Data to Report,传入的数据可以作为数据集提供给KNIME Report Designer,在BIRT环境中进行再加工;使用Image to Report节点,则传入的图像可以作为数据集提供给KNIME Report Designer。

报表相关模块

3.2 报表生成常用到的数据处理节点

数据总是要以预定义的数据表结构到达报表,无论最终呈现方式是什么,都需要先明确报告中所需要的图表的数据结构,再去做相应的数据处理。在本次报表生成中用到的两个主要节点是Groupby和Pivoting。

下图中是需要进行处理的数据表。

源数据

下图中是通过Groupby节点得到的数据结构。在图表1和图表2中会用到brand,date,amount三个维度。

数据简介

下图中是经过Pivoting节点生成的数据透视表,在图表3和图表4中会用到model,brand以及各月份的销量数据。

数据透视表

此外还可以结合Joiner,Math formula等节点,共同进行更复杂的数据处理。

4. 报表设计

4.1基本设置

报表基本设置

报表的基本设计,例如页面大小、边框、标题、页脚等等都在界面最下方的Layout/Masterpage部分完成,当想要设置不同的组件,只需要用鼠标点选相应的部分,下方Properties将切换成对应于将要设置的对象。例如上图中,标题部分被点选后外框显示高亮,则下面的Property自动切换成对应label进行设置。

4.2页面布局设置

KNIME中页面布局设置可以通过Grid完成,从Report Items中将Grid组件拖拽进Report Editor,可以通过设置行列的数量,决定将Report页面划分成几部分,再在格网的每个格子里分别插入标题、图片、表格、文本等内容。插入网格后,可以对相邻网格进行合并,以适应多样的布局需求。

页面布局

4.3使用数据表在Report中生成图表

使用workflow中生成的数据表在Report中生成图形的流程如下:

Select the chart type;

Select the data;

Format the chart.

我们在Report Item中选择Chart,拖入Report Editor中进行编辑,双击图片即可进入编辑设置界面。如图所示为选择图表类型和选择制图所需数据的过程。其中在Multiple Y Axis中可以设置双轴。

调整图表
调整图表

全部设置完毕后在Format Chart中设置图表格式,即可在report中生成图片。但是这里值得注意的是在KNIME的视图中展示的只是排版概况,要想看到真实Report的效果需要预览。

排版预览

4.4使用workflow中的图表直接插入Report

要想在报表中插入之前workflow中生成的各类统计图需要提前有些小的设置。首先在report视图下,保证Report Editor中没有任何内容被点选。然后点击Script选项卡,在下拉菜单中选择beforeRender,并输入如图命令“KNIME.enableSVGImagesInPDF(reportContext)”,

直接插入已生成图表

然后回到Layout选项卡下,插入适用于报表的图片,并在图片高亮的情况下进入Advanced选项卡,在Type expression一栏中输入"image/svg+xml".

直接插入已生成图表

至此插入图片的设置完成,这种方法适用于报表中使用的是workflow中生成的图。

4.5 表格插入

通过拖拽Data Set View中的数据集到Editor中相应位置,就会出现弹窗要求选择要展示的数据字段,选择完成后数据集就以表格形式出现在报表大纲视图中,除了字段之外,表格的数据部分在大纲视图中会被缩略,方便使用者进行排版和设置。视图内很容易进行表格编辑操作,包括表格增加删除行列、边框、尺寸大小、字段名称修改等。

插入表格

4.6 报表导出和预览

报表的预览图标在最上面一排的播放键,右面的小三角可以带出下拉菜单选择预览方式,支持的预览方式包括Web,DOCX,HTML,PDF等多种形式。

预览

在预览界面可以将报表导出,导出格式也很多样,如图所示。

导出

总结:KNIME的报表功能总体上功能很强大,可以进行丰富的版式设计,也可以根据已有数据集完全重新生成图表(本篇使用的是workflow中生成的图片),但是上手稍慢,一些前期设置操作略显复杂。生成的Report中可以任意添加描述、图片、进行任何形式的排版,在完整性上很出色。此外报表的导出多集中于文档形式,无法生成外部链接。关于这部分的实现需要KNIME Server的协助。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,529评论 5 475
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,015评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,409评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,385评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,387评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,466评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,880评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,528评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,727评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,528评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,602评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,302评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,873评论 3 306
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,890评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,132评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,777评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,310评论 2 342

推荐阅读更多精彩内容