来源:机器之心 选自CSDN魏伟
在过去的三十年,深度学习运动一度被认为是学术界的一个异类,但是现在, Geoff Hinton(如图1)和他的深度学习同事,包括纽约大学Yann LeCun和蒙特利尔大学的Yoshua Bengio,在互联网世界受到前所未有的关注。Hinton是加拿大多伦多大学教授和研究员,目前就职于Google,他利用深度学习技术来提高语音识别、图像标签以及其他无数在线工具的用户体验,LeCun在Facebook做类似的工作。当下人工智能在微软、IBM以及百度和许多其它公司受到极大的关注。
我非常兴奋,我们发现一种可以使神经网络变得更好的方法,尤其是这种方法能够揭示大脑是如何工作的时候——Geoff Hinton。
Geoff Hinton 等人亲手缔造了深度学习的复兴
Hinton本科阶段在剑桥学习心理学,他意识到科学家们并没有真正理解大脑——不能完全掌握数十亿神经元之间的交互以及如何提升智力。这些科学家可以解释电信号沿着一个轴突连接一个神经元到另一个,但他们无法解释这些神经元是如何学习或计算的。Hinton认为这些都是大问题,答案可能最终让我们实现1950年代人工智能研究人员的梦想。
他也没有答案,但他将尽全力寻找答案,至少改进的人工神经网络可以模拟人脑的某些方面。“我非常兴奋,我们发现一种可以使神经网络变得更好的方法,尤其是这种方法能够揭示大脑是如何工作的时候,”Hinton说,洋溢着青春的热情。
这些人工神经网络可以收集信息,并且能够做出反应,它们可以理解东西看起来什么样或听起来像什么。当你将单词组合起来,它们在做决定的时候会变得更聪明,而在完成这些过程中不需要人类提供物体或对象的标签,这是传统的的机器学习工具做不到的。
随着人工智能的发展,这些神经网络将更加快速、灵活、高效,它们随着机器规模的增加而变得更加聪明,随着时间的推移将能够解决越来越多的复杂任务。
早在80年代初,当Hinton和同事开始这个想法时,那时的电脑性能还远远不能处理神经网络需要的巨大数据集,成功是有限的,随后人工智能社区背弃了他们,转而去寻找类人脑的捷径,而不是尝试模仿大脑的运作。
但仍然有一些研究人员坚定地支持Hinton的工作。根据Hinton和LeCun回忆,这极为艰难,甚至直到2004年——已经是Hinton和LeCun第一次开发“反向传播”算法神经网络20年之后了——学术界对这些毫无兴趣。
但是那一年,从加拿大先进项目研究所(CIFAR)拿到的极少量资金,并在LeCun以及 Bengio 的支持下,Hinton建立了神经计算和自适应感知项目,这个项目只邀请一些计算机科学家、生物学家、电气工程师、神经科学家、物理学家和心理学家。
通过招聘这些研究人员,Hinton旨在创建一个世界级的团队,致力于创建模拟生物智能的模拟——模拟大脑如何筛选大量的视觉、听觉以及书面线索来理解和应对它的环境。Hinton认为建立这样一个组织会刺激人工智能领域的创新,甚至改变世界,事实证明,他是对的。
Geoffrey Hinton 曾感慨自己的学术生涯就像 ANN (人工神经网络)一样起起伏伏,所幸的是,这位 Gatsby 的创立者一直没有放弃 ANN 的研究。他们为实现早期的想法,定期聚集在一起召开研讨会,构建了更强大的深度学习算法,操作更大的数据集。期间赢得全球人工智能比赛,再然后互联网的巨头开始注意到他们。
2011年,一位NCAP研究员和斯坦福的Andrew Ng在Google建立了深度学习项目,今天,公司用神经网络在Android手机和社交网络以及Google +上标记图像。去年,Hinton加入Google公司,其目的是进一步把这项工作做的更为深入。
每年不到一百万美元的CIFAR投资,Hinton和他的伙伴们带来的回报是丰厚的,这不仅发生在Google也发生在一些国家,包括加拿大。
在这个过程中,Hinton和NCAP已经改变了这个曾经抛弃他们社区的面貌,当下大学生从传统机器学习项目转到深度学习这种现象无处不在了 。毫无疑问,现在深度学习是主流。“我们不再是极端分子了”Hinton说,“我们现在可是炙手可热的核心技术呢。 ”
Hinton也周游世界并为深度学习积极布道,Hinton有一个习惯就是喜欢突然大喊:“我现在理解大脑是如何工作的了!”这很有感染力,他每周都会这样做,你很难模仿。
通过NCAP 和CIFAR,Hinton开办了一家暑期学校,致力于培养新一代的人工智能研究人员。有这么多的商业公司进入这一领域,这是比以往任何时候都更加重要。不仅仅是科技巨头加入这个领域,我们也看到大量的深度学习初创公司包括Ersatz,、Expect Labs以及 Declara。
“我们希望把AI和CIFAR带到一个美妙的新领域,”Hinton说,“一个还没有人或者程序到达的境界。”
和Geoff Hinton一起共同缔造深度学习复兴的大神还包括Yoshua Bengio(如图2)和 Yann LeCun(图3)教授,他们是Hinton坚定的支持者。
Yoshua Bengio(如图2)教授也是机器学习大神之一,他的研究工作主要聚焦在高级机器学习方面,致力于用其解决人工智能问题。他是少有的几个仍然全身心投入在深度学习学术界的教授之一,好多其他教授早已投身于工业界,加入了Google或Facebook公司。
Yann LeCun和Yoshua Bengio不同,他目前就职于Facebook,任Facebook人工智能研究院主任,也是人工智能尤其是深度学习领域最知名的学者之一,在多伦多大学随Hinton读博士后即加盟贝尔实验室,期间研发了卷积神经网络(Convolutional Neural Networks)与曾广泛用于手写识别和OCR的图变换网络方法。2003年加入纽约大学,从事广度与深度兼具的各类研究,涉及机器学习、计算机视觉、移动机器人和计算神经学。
图3:纽约大学AI研究者及Facebook人工智能研究院的主任 Yann LeCun
毋庸置疑的是,深度学习以及整个人工智能领域已成为互联网巨头竞争的一个焦点。
深度学习领域人才极度稀缺
Montreal大学全职教授Yoshua Bengio表示:“深度学习现在炙手可热,目前的困境是缺乏专家,一个博士生大概需要五年的时间培养,但是五年前还没有博士生开始从事深度学习,这意味着现在该领域的专家特别少,可以说弥足珍贵、极度稀缺。”
据说目前深度学习领域的顶尖人才不超过50人,Andrew Ng表示深度学习领域人才匮乏的主要原因首先是数据,对于解决某些领域的问题,获取数据并非易事;其次是计算基础架构工具,包括计算机硬件和软件;最后是这个领域的工程师培养时间非常长。所以科技巨头们包括Google、Facebook、Twitter、百度等纷纷通过收购深度学习领域的初创公司来招揽人才。
Google 2013年3月收购了一家名为DNNresearch的初创公司,这家公司隶属多伦多大学计算机科学院,只有三个人——Geoffrey Hinton 与他的研究生学生 Alex Krizhevsky 和 Ilya Sutskever。之后,Google今年1月份斥资4亿美元收购人工智能初创企业DeepMind,DeepMind由人工智能程序师兼神经科学家Demis Hassabis等人联合创立,是前沿的人工智能企业,其将机器学习和系统神经科学的最先进技术结合起来,建立强大的通用学习算法。另外,Google还收购乌克兰面部识别技术开发商Viewdle。
Google不断的收购深度学习领域的公司最主要的目的是“抢购”一批世界上最一流的专家,在一个迅速成长的人工智能领域里面,这些专家无一不是佼佼者。
Facebook也在2012年以近6000万美元的价格收购以色列人脸识别公司Face.com。人事方面,任命计算机科学家Yann LeCun(图3)作为人工智能研究院的主任,用深度学习专业知识来帮助创建解决方案,更好地在每天上传到Facebook上的3.5亿张照片和视频中识别人脸和对象。去年8月13日Facebook又宣布收购了语音识别及机器翻译公司Mobile Technologies,后者将会帮助我们从图片识别拓展到语音识别领域。假以时日,Facebook可能会开发出交互更加自然的服务,而且相对于任何现有技术,它还会帮助解决多得多的问题。
Twitter 今年7月29日收购了基于深度学习的计算机视觉创业公司Madbits。Madbits这家公司是由Facebook人工智能实验室主任Yann LeCun以前两名学生创办的,开发了可自动理解、组织和提取媒介内容信息的视觉智能技术。这项基于深度学习的计算机视觉技术已经开发完成,正在测试。Twitter上每天都会出现无数的图片。收购Madbits可以帮助Twitter推出诸如图像搜索的功能,基于图像内容改进搜索排名,甚至是通过分析图像来更好地理解人们的推文内容。
其他公司。雅虎收购深度学习公司LookFlow和图像标注公司IQEngine;QualComm收购图像识别公司Kooaba; Pinterest收购物体识别公司VisualGraph;Dropbox收购图像标注公司Anchovi Labs;百度成立李彦宏亲自挂帅的深度学习研究院,有Andrew Ng、余凯等技术大牛加盟; 至此,深度学习领域的几位大牛基本上都各有所属。
深度学习的误区及产品化浪潮
百度首席科学家Andrew Ng表示:“目前围绕Deep Learning存在着某种程度的夸大,它不单出现于媒体的字里行间,也存在于一些研究者之中。这是一种不健康的氛围。将Deep Learning描绘成对人脑的模拟,这种说法非常具有吸引力,但却是过于简化的模仿,它距离真正的AI或人们所谓的‘奇点’还相当遥远。”
目前这项技术主要是从海量数据当中学习,理解数据,这也是现今有关Deep Learning技术研究和产品发展的驱动力。而具备与人能力相匹配的AI需要无所不包,例如人类拥有丰富的感情,这些都是当下Deep Learning研究尚未涉及的。今天,AI领域最大的挑战和短板是Perception,如何让机器更好地理解人的意图;而这正是 "深度学习"可以发光发热的范畴。
一项技术能够快速成为主流,一个主要原因就是能够快速推出成熟的产品,深度学习也不例外,所以深度学习产品化是一个大趋势,追求不切实际的“天网”或者电影情节的高科技未免太急功近利、不切实际。目前 "深度学习"让Google产品在语音,文本和图像的识别上变得更加聪明,可以更准确地洞悉我们的信息输入,更人性化地理解我们的意图。现在,每个安卓手机的语音识别以及Google街景中的图像处理都有"深度学习"的影子。笔者认为,随着深度学习的发展和科技公司加大投入,会有越来越多的产品推向市场。