VLDB(Very Large Data Base)会议是全球享有盛誉的顶级数据领域的学术会议,创办至今已经43年。
今年的会议在德国慕尼黑工业大学(TUM)举办,1000多人注册参会。记录下打酱油的几点体会备查:
(1)硬件如何改变数据库? 大会keynote#1主题是硬件变革给数据库带来的机遇。 芯片、存储和网络都在变,原有经典db的设计假设已经时移世易,德国在软硬一体化设计方面很强,比如SAP HANA。SAP&德累斯顿大学提交了多篇如何在数据库中使用NVRAM的文章。
(2)下一代数据平台是什么?大会keynote#2 芝加哥大学的Franklin讲spark的历程和展望。MapReduce当时刚提出的时候被数据届元老们批评是巨大的倒退。从Hadoop到Spark,四五年时间吸收了数据库届三十年积累的诸多经典技术,在性能、扩展性和容错方面进步巨大,现在终于从边缘地带登堂入室了,下一步要更好的支持data science,解决易用性、分析流水线和安全等问题。可以说,凭借Spark,美国在平台软件上占据绝对优势。不过,德国的Flink在流处理方面表现也很出众。
(3)深度学习将吃掉数据库?Deep learning (m)eats database? (keynote#3)的主题是DL与数据库。十年前,数据分析都在数据库上做,数据库就是数据分析。而现在,流行的数据科学技术栈,从下(存储)到上(语言)都正在逃离数据库。深度学习大浪已来,数据库领域要自我救赎,就需要迎合AI的需求,融入数据科学的体系。
(4)中国力量崛起。华人获得了大会设置的6个奖项中的4个:十年最佳论文,最佳青年学者和两个最佳Demo奖,非常了不起。中国参会人数近100,华人总共估计200+,增长很快。会场有幸见到了国际上华人数据库圈子里的众多大神。阿里&蚂蚁金服、华为、百度、腾讯都有不少人参会,一线玩家基本都在,找人&看趋势,他们已经国际化了。
(5)跨学科/领域合作很重要。数据科学要跨领域才能找到场景和数据。美国和德国底层技术为什么强,建设夸领域研究中心的经验值得学习。美国NSF支持在美国东南西北各建立一个数据科学创新中心。
德国柏林的爱因斯坦中心也在跨领域合作方面取得了很好的效果。另外,美德很多教授同时也在大公司任职,产学研集于一身,问题和成果直接面向产业里的真实问题,直接转化。而我们国内貌似脱节很严重,成果偏软不接地气,转化通道也不畅通。
(6)区块链引起数据库届重视。今年的另一个数据库顶级会议sigmod发表了一篇区块链评测文章。这次vldb上,碰到了潜心研究智能合约形式化验证5年(5年!!)的黎同学,忽悠他回国内发币,未遂。数据库届元老,IBM的Mohan同志还专门开了场讲座,重点讲解区块链与数据库技术的那些事,场面是这样的:
(7)城会玩。下大雨,水流暴涨,英国花园旁边的一条小河成了冲浪者的乐园。慕尼黑不仅有肘子和啤酒。
(8)中印人民把酒言欢。会议期间,欣闻印军撤退。晚餐竟碰到这位哥哥掏出一瓶茅台(据说是他的中国学生送的)到中国人扎堆的桌上敬酒,瞬间喝光,喜感十足。