1.背景
KNIME的报表设计基于BIRT(Bussiness Intelligence Reporting Tool),这两种工具在同一个平台内可以共同协作,对于每个工作流,可以通过生成报告按钮直接进入report界面进行报表设计。
在KNIME中,我们建立workflow进行数据操作,生成数据和结果,而BIRT可以用这些内容生成报表。每次在workflow中修改后,BIRT会进行自动更新。
通常报表只需要对数据分析中的一部分结论进行展示,KNIME 的Report功能的好处在于,可以分别将这些信息接入BIRT,并进行报表设计。
2.从Workflow到Report
一个workflow只能与一个报表相连接,我们可以通过workflow界面上的“Report”icon进入BIRT环境,此时我们打开的是与当前所在workflow相连接的report。
本篇的report采用如图所示的workflow,将分析得出的统计图和统计表展示在报表中。
2.1 Report designer拓展模块的安装
上次介绍了KNIME的几大基础模块,然而在基础模块中不包含报表工具。上篇也提到了KNIME有Extension功能,而Report designer的功能即可通过这个功能进行下载安装。具体的方法是“File”→“Install KNIME extention”,搜索Report designer并且进行安装。
安装完成后,在Node Repository栏目中就会多一个模块——Reporting,下面包含两个节点,分别是Data to Report和Image to Report。二者的区别会在下文中提到。
2.2 KNIME 中的BIRT环境
搭建完workflow后,点击图中所示'Report' icon,就会打开新的Report编辑页面。
在这个界面中可以完成报表的结构设计,添加或修改文字、图片、表格等多种内容。界面共分为以下几个部分——KNIME Workflows,Data Set View,Report Items,Report Editor,Layout/Master Page。其中在workflow中添加了Reporting节点的数据集会出现在Data Set View,也就是报表中的数据来源;Report Items中是组成报表的元素类型;Report Editor是报表排版操作界面,在这里可以看到报表视图大纲(不是真实报表);Layout/Master Page中可以进行Report,Grid,Item等不同级别的报表内容设置。
3.数据准备
3.1 Report中的数据来源
在report中呈现的内容可以有两种来源,一种是workflow中已经生成的image,不需要再进行修改可以直接用于report;另一种是workflow中已经进行过数据处理,想要呈现在报表中的是需要再加工的图形或表格(再加工是指对图表进行双轴、聚合等设置,或者在表格中进行指标计算等)。
以上两种情况分别对应于Reporting模块中的两个节点,使用Data to Report,传入的数据可以作为数据集提供给KNIME Report Designer,在BIRT环境中进行再加工;使用Image to Report节点,则传入的图像可以作为数据集提供给KNIME Report Designer。
3.2 报表生成常用到的数据处理节点
数据总是要以预定义的数据表结构到达报表,无论最终呈现方式是什么,都需要先明确报告中所需要的图表的数据结构,再去做相应的数据处理。在本次报表生成中用到的两个主要节点是Groupby和Pivoting。
下图中是需要进行处理的数据表。
下图中是通过Groupby节点得到的数据结构。在图表1和图表2中会用到brand,date,amount三个维度。
下图中是经过Pivoting节点生成的数据透视表,在图表3和图表4中会用到model,brand以及各月份的销量数据。
此外还可以结合Joiner,Math formula等节点,共同进行更复杂的数据处理。
4. 报表设计
4.1基本设置
报表的基本设计,例如页面大小、边框、标题、页脚等等都在界面最下方的Layout/Masterpage部分完成,当想要设置不同的组件,只需要用鼠标点选相应的部分,下方Properties将切换成对应于将要设置的对象。例如上图中,标题部分被点选后外框显示高亮,则下面的Property自动切换成对应label进行设置。
4.2页面布局设置
KNIME中页面布局设置可以通过Grid完成,从Report Items中将Grid组件拖拽进Report Editor,可以通过设置行列的数量,决定将Report页面划分成几部分,再在格网的每个格子里分别插入标题、图片、表格、文本等内容。插入网格后,可以对相邻网格进行合并,以适应多样的布局需求。
4.3使用数据表在Report中生成图表
使用workflow中生成的数据表在Report中生成图形的流程如下:
Select the chart type;
Select the data;
Format the chart.
我们在Report Item中选择Chart,拖入Report Editor中进行编辑,双击图片即可进入编辑设置界面。如图所示为选择图表类型和选择制图所需数据的过程。其中在Multiple Y Axis中可以设置双轴。
全部设置完毕后在Format Chart中设置图表格式,即可在report中生成图片。但是这里值得注意的是在KNIME的视图中展示的只是排版概况,要想看到真实Report的效果需要预览。
4.4使用workflow中的图表直接插入Report
要想在报表中插入之前workflow中生成的各类统计图需要提前有些小的设置。首先在report视图下,保证Report Editor中没有任何内容被点选。然后点击Script选项卡,在下拉菜单中选择beforeRender,并输入如图命令“KNIME.enableSVGImagesInPDF(reportContext)”,
然后回到Layout选项卡下,插入适用于报表的图片,并在图片高亮的情况下进入Advanced选项卡,在Type expression一栏中输入"image/svg+xml".
至此插入图片的设置完成,这种方法适用于报表中使用的是workflow中生成的图。
4.5 表格插入
通过拖拽Data Set View中的数据集到Editor中相应位置,就会出现弹窗要求选择要展示的数据字段,选择完成后数据集就以表格形式出现在报表大纲视图中,除了字段之外,表格的数据部分在大纲视图中会被缩略,方便使用者进行排版和设置。视图内很容易进行表格编辑操作,包括表格增加删除行列、边框、尺寸大小、字段名称修改等。
4.6 报表导出和预览
报表的预览图标在最上面一排的播放键,右面的小三角可以带出下拉菜单选择预览方式,支持的预览方式包括Web,DOCX,HTML,PDF等多种形式。
在预览界面可以将报表导出,导出格式也很多样,如图所示。
总结:KNIME的报表功能总体上功能很强大,可以进行丰富的版式设计,也可以根据已有数据集完全重新生成图表(本篇使用的是workflow中生成的图片),但是上手稍慢,一些前期设置操作略显复杂。生成的Report中可以任意添加描述、图片、进行任何形式的排版,在完整性上很出色。此外报表的导出多集中于文档形式,无法生成外部链接。关于这部分的实现需要KNIME Server的协助。