如何用开源bi,打造自己的轻量级bi系统

对于程序员来说,开源的东西都是好的,别的不说,因为可以自己自己随意开发,毕竟每个人都喜欢自己写的代码嘛,也或者,就是不想花钱哈哈哈哈(扎心了)

就拿最近很火的BI来说吧,BI分两种:开源BI和商用BI,说起开源BI就是有爱又恨,这一切都要从微软带起了商业风说起....

我在网上搜到了一下2018年BI的市场占有率:


说到软件,可能第一反应就是国外的好,于是就先尝试了国外的开源BI。第一个接触的开源BI是pentaho,实在是太臃肿了,花了半年时间没有搞定,bug又多,修改不了。第二个是superset,可视化很强大,不过需要安装Linux,对于非技术人员很不友好,毕竟现在的BI都主打自助式。第三个开源BI就是JasperReports了,这是程序员最受欢迎、最常用的开源报表工具,常和ireport一起搭配使用,不过它有两个致命的缺点:需要学习编程,不支持多源数据源,这无疑是把自己未来的路给封死了....使用了这么多之后,我们决定试试国内的开源BI。

国内的开源BI很多都是假开源,阉割很多核心功能,或者是商业用就要收费。而BI产品又很贵,在商业bi用的比较多的就是tableau,sever价格10万,10个账号,增加一个账号需要1万。由于最近要给公司实施BI,和工程师聊过,如果自己开发一套BI的话,工作量非常大,开发不出来的可能性很大,风险大。于是怎么办呢?只能硬着头皮上Tableau,贵就贵吧,毕竟是全球第一,贵的东西总买不了上当吧。用了一段时间发现,这什么玩意?售后服务太差了,虽然各种图表酷炫至极,还带有语音控制,但是我不需要这些,我只是想要在出bug的时候能有帮助文档或者客服人员帮助我解决,而不是我们的研发像个无头苍蝇一样。

在信息部同事的不断调研之后,我们决定使用国内的BI产品FineBI,在IDC认证的市场占有率上,它是第一。刚刚开始也是抱着试试看的心态,没想到用几天以后发现功能着实贴合企业场景,业务人员可以自己拖拽分析,再也不用排队等IT开发了。今天就给大家讲讲我的使用心得,如何用FineBI打造自己的BI系统。

搭建企业BI系统的第一步是什么?当然是下载BI工具!登录帆软官网,点击免费下载,提醒一下,永久免费版的~企业版才需要收费


打开后就是这样了,页面简洁,突出重点,适合我们这种上了年纪的人,太酷炫会花眼。

那它是怎么实现企业的数据分析的呢,别急,听我慢慢说,先来说说它的数据处理引擎,spider大数据引擎,正是因为有了它,finebi跑1亿数据量的100分组表,时间在0.75s左右,够快吗?Excel相比之下简直弱爆了!

我用FineBI之前,做数据可视化一直都是用的数据透视表,这里就两个比较重要的方面来比一比吧。

1.Excel是平面公式计算,而FineBI是自助式即时探索拖拽分析

我们使用excel做数据计算的时候,往往需要用户进行大量复杂繁琐的的平面单元格公式计算,操作界面是这样的:


而使用FineBI进行数据探索分析时,我们只需要通过鼠标得点击和字段拖拽操作即可完成对数据的整个探索分析过程。FineBI基于著名的图形语法设计,以“形状“和对应的“颜色“,“大小“,“提示“,“标签“等属性进行图表类型替代,这样一来FineBI也就摆脱图表类型对可视化效果的限制,从而达到无限制图表类型的展现能力,让用户轻松实现对数据的即时洞察和见解。


2.FineBI的OLAP多维分析是数据分析大杀器

除了丰富的可视化展示效果之外,FineBI还支持前端的一些丰富多维分析操作,例如钻取、过滤、跳转、数据预警、数据联动等。

首先像钻取,大家都比较熟悉。比如某个企业要统计全国各个省市BI的销量,那么看了之后发现,广东的销量比较多,上海北京的也很多。那在看上海地区销量分布的时候,就可以钻取点进去,一看浦东的最多,看广东城市的销量,钻去点进去,发现深圳和广州的都比较多。


最后,就到了大家最关心的点,FineBI的数据分析实操!

1、FineBI能从很多种数据源导入数据:如两大主流开源平台(Hadoop,Spark),Excel,CSV,XML,以及各类数据库(SQL Server,Oracle,MySQL等),这点倒是挺方便的,无论我从哪里收集到的数据,都可以一起分析了。


2、那如何导入数据呢?仅需2步,数据准备—添加业务包,业务包是用来统一整理数据表的。就得到如下的数据明细。这里可以自动识别数据的字段类型,也可以修改字段类型。


至此,数据就导入成功,接下来开始正式分析。

3、再来说说它的自助式分析吧,我相信这是很多人都关心的一个点,如何能让业务人员自己去探索和分析数据,这样会节省与IT的沟通,也会节省一部分人力成本,双赢。


为了完美支持业务员的分析工作,FineBI作为自助式开源BI工具,不同与传统BI,降低了代码操作,摒弃了手动建模,将重点放在了业务员可理解的前端。

业务员可只需要从数据包中读取数据,在前端像手机一样直接拖拽字段做分析,不需再要问数据在哪?数据好了没?数据不对等这些问题。

各种现成的计算公式,基本告别SQL和代码。


4.精美、酷炫、实用的数据可视化,为什么要加实用两个字呢?现在有很多的数据分析软件,华而不实,只知道提升图表的酷炫效果,而FineBI却是真正地从可视化中发现企业的问题,就拿我曾经做的一个项目来说吧,领导看了

第一眼就觉得,图表的配色确实让人满意,也能让集团高层从大屏上面直接发现问题。



下面这些图是笔者20分钟不到就做好的,稍加美化,绝对可以达到客户对于颜值的要求。

要知道同样的工作使用R语言的ggplot2至少要2小时(含调试),使用Python的matplotlib就更久了,而用FineBI,我15分钟就可以做出来。

总结

开源BI其实真的有很多,那怎么挑选最好的?我上面提到的是一部分,还有一个点:看这款BI能否适合自己的企业发展,无论这款BI被描述地有多酷炫,有多好,在企业的工作场景下用起来才是最好的开源BI。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,980评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,178评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,868评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,498评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,492评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,521评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,910评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,569评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,793评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,559评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,639评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,342评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,931评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,904评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,144评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,833评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,350评论 2 342

推荐阅读更多精彩内容

  • 前面说完了大数据开发平台的核心组件,作业调度系统,接下来讨论一下大数据开发平台的脸面之一,数据可视化平台。和调度系...
    彩色蚂蚁阅读 4,756评论 1 18
  • 170
    樊勇明阅读 81评论 0 0
  • 暑假将至,不断有一些朋友问我说:想找兼职,什么兼职能赚到钱?网上兼职骗子太多,有没有什么渠道能快速找到靠谱的兼职?...
    假的不是我阅读 1,556评论 4 30
  • 最近热播的“好先生”,我每天在单位吃午饭的时候边吃饭边看,消磨午饭时光。也基本上都是跟着更新看的。但看了这么多...
    汪汪汪小狗狗阅读 219评论 0 0
  • 最近一段时间状态不太好,原因是自我管理方面出了问题。 回想起一年前的这个时候,自己对时间无比珍惜,而现在却是很懈怠...
    谷凯_d026阅读 443评论 1 4