要问当前什么BI工具最热门,那肯定非PowerBI莫属,知乎、B站经常出现各类使用教程,堪比BI界的Python。
对于我这种用惯了Tableau来说,确实会有些眼红PowerBI某些特性,比如高灵活的数据处理能力、与Office家族及Azure云服务的完美集成、强大的DAX分析语言。
眼红归眼红,还是离不开Tableau。主要是因为它的可视化效果太过于出色,身为图表界的颜狗,Tableau每每会让我惊艳到,而Power BI就有点朴素了。
但PowerBI和Tableau都有一个问题,使用成本高,就是需要花很多时间去研究才能做出像样的企业级报表。这不是软件的问题,而是很多公司没有这样的人才去支持。
我尝试过去研究各种其他的BI工具,比如开源的superset、metabase,国产的像永洪bi等,各有优劣,开源二次开发效果好、国产更适合国内场景和使用习惯。
前几天,老板让我做个部门内部的数据看板,用来监视用户留存及下单情况,还会涉及到回归、聚类的算法,对用户进行定期的分类。
我分析了这个需求,有三个问题要解决。
一是数据量比较大,一天有几百万用户的访问数据;
二是支持部门同事提取数据的需求,尽可能要简单易用;
三是可以自定义算法,实现多元回归、分类、聚类的功能。
我提出用Tableau来实现,被老板委婉地pass掉,说咱们得为公司节省成本,这季度没预算去采购整个部门的Tableau,巴拉巴拉一大堆。
那superset可以啊,开源免费,老板立马夺命五连问,superset?简单吗?耐用吗?安全吗?有那种炫酷的大屏效果吗?
我无言以对,superset确实部署起来有点费工夫,赶紧去网上找免费的拖拽式的能做国产大屏的BI工具。
旁边座位的李大头凑过来,说你可以试试国产BI,大屏做起来杠杠的,不信你看我之前搞的一个项目,十五天开发周期,七天搞完。
这李大头平时就爱偷懒,但有点小聪明,属于那种事半功倍的人。
他用的是永洪BI,还算主流的国内BI服务产品,和powerbi、tableau处于不同赛道。
关键这个软件是免费的,对部门级数据部署来说这很重要。
行,大头那你教教我。我得学学如何科学地偷懒摸鱼,并且能让老板满意。
他先给我看了永洪BI的一些案例,典型的国内企业大屏,领导肯定喜欢。
当然,大屏会有数据动态展示,这才够炫。
还有轻量化的企业报表,图表形式和页面布局看着清爽舒服。
看了永洪BI的产品形态,它和Tableau的主要差异在于,前者更注重报表、大屏的开发,简单直接,后者更侧重商业分析、可视化表达。
永洪BI直接在dashboard页面制作报表和大屏,没有了单独的sheet,这样虽然功能丰富性上打了折扣,但缩短了开发路径,效率得到大大提升。
李大头虽懒,但对同事很有耐心,他把安装到使用的全部步骤都展示了一遍。
永洪BI直接在永洪的官网下载,桌面开发工具叫作Yonghong Desktop,和Tableau Desktop性质一样。
桌面软件大概950M,下载很快,需要预留2GB的安装空间。
下载完成后,一路next就能完成安装,然后打开就能看到下面的页面。
几秒钟后就能进入软件主界面。
前面说过,永洪BI制作报告的步骤很简洁,加载数据源后直接在dashboard界面制作图表即可。大头梳理好了使用步骤,真的用心。
永洪BI支持几乎所有的主流数据库,包括MySQL、Oracle、SQLServer等传统关系型数据库,还有HIVE、HBASE等大数据系统。
添加数据源操作非常简单,一般我们可以导入excel和文本文件。
或者连接MYSQL数据库,然后通过SQL去抽取数据。
加载完数据后,就可以制作报告了,从右边的组件区,挑选合适的图表组件到左边dashboard空白区,开始制作第一张图表。
大头用永洪BI自带的咖啡店数据集示范了如何拖拽数据,实现一张可视化图表。
这里数据形式和tableau划分一样,分别是维度和度量,维度代表种类、度量代表数值。
上面是分区域的咖啡种类销量柱状图,先选取柱状图组件,接着只需要把维度(市场分布、产品种类)拖到列,把度量(销量)拖到行即可完成图表制作。
除了常规图表外,这款BI还能傻瓜式的制作南丁格尔玫瑰图、仪表图、轨迹图等较为复杂的图表,这在Tableau里需要一些技巧才能实现。
大头演示了南丁格尔玫瑰图、仪表图的制作过程,几秒钟完成,让我惊讶到。
上面这些图表都支持数据导出,导出的形式有PDF、EXCEL、Word、PNG、CSV,我们特意看了下导出EXCEL的形式,交差表会有数据,如果是图表直接是高清图片形式。
大头的演示看起来很简单,可能是我之前一直用Tableau的原因,发现不少操作时类似的。
接着,他说厉害的来了,永洪BI可以用R或者Python写算法模型,来实现机器学习、商业模型、复杂可视化等。
里面自带了几个经典的模型,可以直接用,用户也可以自己新建。
看下客户流失模型,通过逻辑回归模型来预测。
使用R进行定制可视化:
使用Python定制可视化:
Tableau和PowerBI也支持Python、R进行深度开发,但用起来似乎不那么方便,需要配置。
大头说完后,我拍了拍他的肩膀,调侃道你小子是会想办法哈,这种敏捷、轻量的BI工具可以省很多事,等我把这个活搞定得请你吃个饭。
他笑了笑,该省事的时候就得想着法省事,偷懒是门技术活啊。
我把刚刚大头演示的东西和老板说了一遍,他没表示同意也没表示不同意,说工具你来挑,我要看结果。
我和大头相视一笑。
接下来干活,开始搭建用户数据看板,这块总共分为三大部分。
1、用户留存看板,显示用户的注册、登入、使用、流失、分享等情况。
2、用户画像看板,根据用户的使用习惯和静态标签,对用户进行分群。
3、用户下单看板,展示不同产品的下单情况,包括订单金额、成本、利润等。
这里选择第三个简单展示下我做的一个看板模块,功能还在完善。
整体分布比较简单,包括标题、订单数据、订单金额走势、订单金额类型分布、订单金额平台分布等。
经过处理的底表数据共有14个字段,每一行代表一个订单,具体如下:
接下来就是导入数据到永洪BI中,然后制作相应的图表。
制作图表的过程之前也说过了,并不难,只要选好合适的图表组件,放入数据字段就可以。
当然,排版和配色对数据看板来说也是一个很重要的因素,需要符合使用场景,好的UI会让你的作品看起来会更加让人信服。
我觉得看板制作需要注意三点:
1、选择合理的维度,哪些数据是你要展示的
2、选择合适的图表,力求表达简洁明了
3、选择合情的布局,让人看起来详略得当,不违和
这个Demo级的报表总共花了我两小时,从刚上手到完成一个dashboard,已经算非常快了。主要是因为永洪BI的功能区比较分明,掌握整个布局,就能很容易完成一个图表。