最近几年,人类在一些科技前沿领域取得了重大突破,我们看到许多存在于科幻小说中的内容成为现实:人工智能击败人类顶尖棋手,自动驾驶汽车技术日趋成熟,生产线上大批量的机器人取代工人……不管你承不承认,智能时代到来已经是不争的事实。
面对这个快速发展的社会,我想问的是,你焦虑吗?显然,绝大多数人是焦虑的,要不然罗胖的得到专栏也不会卖得那么好。
当然,这里我并不是让你去订阅得到,并且我也不建议你去花这个冤枉钱,正如我们在《临界知识》这篇文章中提到的,互联网时代信息过载,是个人都要拯救你的知识焦虑,更重要的是掌握各种纷繁复杂知识背后的底层规律,所以......
其实你关注我就可以了啊哈哈哈哈...
不过话说回来,得到的专栏可以不买,但是上面推荐的许多书还是值得一看的。比如今天要向大家介绍的这一本——《智能时代:大数据与智能革命重新定义未来》。
本书在罗辑思维上首印8小时即告售罄,雷军、邬贺铨、李善友等大佬撰序推荐,截至目前豆瓣评分高达8.5。
作者吴军博士,毕业于清华大学计算机系(本科)、电子工程系(硕士)和美国约翰 · 霍普金斯大学计算机科学系(博士)。他2002年加入Google公司,并获得和申请了十余项美国和国际专利。2010年,吴军博士离开Google,加盟腾讯担任副总裁。
为什么说这本书非常值得一读呢?首先,作者非常牛,吴军博士著作等身,先前已出版过《浪潮之巅》、《文明之光》、《数学之美》等畅销书,其中《浪潮之巅》销量更是达到百万级别。
其次,本书对大数据与智能革命带来的思维革命、技术上的挑战,以及机器智能如何改变人类社会等方面都做了全面的讲解,对于提升个人认知和对未来社会的前瞻性认识大有裨益。
书中提到,与工业革命相比,人工智能带来的革命程度将更深更广。一些人对变化开始有了一定程度的担心,认为机器智能将在未来危及整个人类的工作机会,大多数人在未来将不再被社会需要。
不可避免,每一次大的技术革命都会带来阵痛,但同时诞生的,还有更多新的机会。想要在智能时代取得胜利,我们需要做的第一步,就是打破现有的认知束缚。接下来就让我们跟随作者一起,走近这即将到来的智能时代。
1. 大数据和机器智能
不知道你发现没有,现在我们经常能听到“大数据”这个词,给人感觉逼格非常高。比如你去菜市场买水果,问老板这个苹果甜不甜,老板跟你说很甜你也不一定会信。但老板要是说,我这个苹果是山东烟台产的,经过成千上万次的实验后,利用大数据技术分析确定了最佳光照时间、最适宜的培育温度和最充足的水分,你觉得它甜不甜?
你一听,那肯定甜啊对不对,大数据技术都用上了,苹果不甜难道三星甜吗!
当然,苹果甜不甜我不清楚,但是这里对大数据的理解却是错误的。由于互联网的发展不过二十年,而对大数据发展带来直接贡献的移动互联网也才十年时间,因此现在许多人对大数据也有很大的误解。
1.1 大数据的特征
在2000年以后,由于互联网特别是后来移动互联网的出现,数据量不仅剧增,而且开始互联,这才有了大数据的概念。要谈大数据的问题,我们首先要讲清楚什么是大数据,以及它都有哪些特征。
大数据最明显的特征就是体量大,这点没有什么异议。但是仅仅有大量的数据并不一定是大数据,比如一个人基因全图谱数据,是在上百GB到TB数量级,这个数据量不可谓不大,但是它没有太大的统计意义。
大数据之所以有用,是因为它除了数据量大之外,还具有其他的特征,包括多维度和完备性。
什么是多维度?简单来讲就是说以前我认识你可能只知道你叫什么名字,性别男还是女,长相如何,其他多余的信息我就不清楚了。而现在除了姓名、性别、样貌之外,通过互联网积累的数据,我还能知道你用什么手机、学历如何、家住哪里,甚至你的购物行为、使用什么浏览器上网、去过哪些地方等等。
因此,多维度的信息能够让我对你更加了解。现在许多互联网企业强调构建用户画像,以便用于精准营销,其背后就是大数据的功劳。
大数据的第三个特征是“完备性”。这个很好理解,比如以前我们做问卷调查,如果样本群体数量太多,我们采用的方法就是随机抽样。但大数据用不着随机抽样,有100个我们就调查100个,有10000个就调查10000个。因此,完备性能让分析结论非常精准。
为什么能做到这样?因为这些数据其实在互联网上都已经存在,你要做的就是把它挖掘出来,而现在计算机的运算速度已经非常牛逼,每秒几亿次,几万几百万的数据根本就不是事儿。
1.2 什么是机器智能
与“机器智能”这个词相比,我们更经常听到的是“人工智能”。那么作者为什么要用“机器智能”呢?它和“人工智能”又有什么关系?
事实上,人工智能并非近几年才兴起,计算机科学家早在二十世纪五六十年代就已经开始致力于人工智能方面的研究了,并且以“图灵测试”正式定义了什么是人工智能。
图灵测试说的是,让一台机器和一个人坐在幕后,让一个裁判同时与幕后的人和机器进行交流,如果这个裁判无法判断自己交流的对象是人还是机器,就说明这台机器有了和人同等的智能,我们可以称之为人工智能。
但严格来说,人工智能这个名词在今天又两个定义,第一个是泛指机器智能,也就是任何可以让计算机通过图灵测试的方法,包括本书中讲的数据驱动方法。第二个是狭义上的概念,即20世纪五六十年代特定的研究机器智能的方法。
因此,学术界将机器智能分为传统人工智能的方法和现代其他的方法(比如数据驱动、知识发现或者机器学习)。为了便于区分,本书中尽可能地用机器智能表示广义上的概念,而在使用人工智能表达时,通常指传统的人工智能方法,所以在本书中,机器智能的概念包含了人工智能。
1.3 大数据与机器智能的关系
在有大数据之前,计算机并不擅长解决需要人类智能来解决的问题,但是今天这些问题换个思路就可以解决了,其核心就是变智能问题为数据问题。由此,全世界开始了新的一轮技术革命——智能革命。
尽管在过去的半个世纪,计算机的运算速度一直呈指数级提升,可以做的事情越来越多,可是给人的印象依然是“快却不够聪明”,比如它不能回答人的提问,不会下棋,不认识人,不能开车,不善于主动做出判断……然而当数据量足够大之后,很多智能问题都可以转化成数据处理的问题,这时计算机开始变得聪明起来。
以1996年IBM深蓝计算机战胜国际象棋世界冠军卡斯帕罗夫为例,深蓝在评估自己和对方的胜率时,都是基于对历史数据考虑卡斯帕罗夫可能采用的走法,对不同的状态给出可能性的估计,然后根据对方下一步走法对盘面的影响,找到一个最有利于自己的状态,并走出这步棋。
因此,深蓝的团队其实把一个机器智能问题变成了一个大数据的问题和大量计算的问题。而AlphaGo在具体的算法上虽然和深蓝略有差异,但是它们博弈的原理其实是相同的。
我们对大数据重要性的认识不应该停留在统计、改进产品和销售,或者提供决策的支持上,而应该看到它(和摩尔定律、数学模型一起)导致了机器智能的产生。而机器一旦产生和人类类似的智能,就将对人类社会产生重大影响。毫不夸张地讲,决定今后20年经济发展的是大数据和由之而来的智能革命。
2. 大数据的本质
到这里,我们已经明白了大数据可以解决机器智能问题,但是其背后的原理是什么呢?要回答这个问题,我们需要简单介绍一下机械思维和香农的信息论。
注意了,接下的内容有点高能,如果你能认真看完并掌握,那么将极大提升你的个人认知水平和对大数据本质的理解!
2.1 机械思维
自17世纪以来一直指导我们日常做事行为的最重要的思维方式是——机械思维。
从欧几里得到托勒密再到牛顿,在思想方法上可以说是一脉相承而又不断发展的。牛顿不仅把欧几里得通过逻辑推理建立起一个科学体系的方法论从数学扩展到自然科学领域,而且把托勒密用机械运动模型描述天体的规律,扩展到对世界任何规律的描述。后来人们将牛顿的方法论概括为机械思维,其核心思想可以概括成这样几句话:
1.世界变化的规律是确定的;
2.因为有确定性做保障,因此规律不仅是可以被认识的,而且可以用简单的公式或者语言描述清楚;
3.这些规律应该是放之四海而皆准的,可以应用到各种未知领域指导实践。
这些其实是机械思维中积极的本质,而机械思维直接带来了工业大发明的时代,工业革命,是机械思维的结果。
2.2 世界的不确定性
机械思维认为世界变化的规律是确定的,是可以被认识和描述的,因此它关心的是因果关系,然而不确定性在我们的世界里无处不在。
我们经常可以看到这样一种怪现象,很多时候专家们对未来各种趋势的预测是错的(特别是金融领域),这并不是因为他们缺乏专业知识,而是由于不确定性是这个世界的重要特征,以至于我们按照传统机械论的方法难以做出准确的预测。
世界的不确定性来自两个方面,首先是当我们对这个世界方方面面了解得越来越细致之后,会发现影响世界的变量其实非常多,已经无法通过简单的办法或者公式算出结果。
其次,不确定性的第二个因素来自客观世界本身,它是宇宙的一个特性。比如在宏观世界里,行星围绕恒星运动的速度和位置是可以计算得很准确的,但是在微观世界里,电子在围绕原子核做高速运动时,我们不可能同时准确地测出它在某一时刻的位置和运动速度,这便是量子力学中的测不准原理。
在现实生活中情况也是类似的,不论是因为数据量太大导致的不确定性,还是因为世界本身带有的不确定性,总之,世界上很多事情是难以用确定的公式或者规则来表示的。
但是它们并非没有规律可循,通常可以用概率模型来描述。在概率论的基础上,香农博士建立起一套完整的理论,将世界的不确定性和信息联系了起来,这就是信息论。
香农在信息论中借用了热力学里熵的概念,他用熵来描述一个信息系统的不确定性。香农指出,信息量与不确定性有关:假如我们需要搞清楚一件非常不确定的事,或是我们一无所知的事情,就需要了解大量的信息。
可以认为,信息量的度量就等于不确定性的多少,这样香农就把熵和信息量联系起来了。他还指出想要消除系统内的不确定性,就要引入信息。
不得不说,这个确实厉害。如果你还没看懂的话,建议想办法把它搞懂,信息熵这个知识点很重要,这也是为什么我花这么大的篇幅进行介绍。
2.3大数据的本质
有了信息论这样一个工具和方法论,我们便很容易认清大数据的本质了。当我们了解到信息或者说数据能够消除不确定性之后,便能理解为什么大数据的出现能够解决那些智能的问题,因为很多智能问题从根本上来讲无非是消除不确定性的问题。
由此可见,大数据的科学基础是信息论,它的本质就是利用信息消除不确定性。虽然人类使用信息由来已久,但是到了大数据时代,量变带来质变,以至于人们忽然发现,采用信息论的思维方式可以让过去很多难题迎刃而解。
3. 从历史经验看大数据的作用
在历史上,一项技术带动整个社会变革的事情也曾经发生过。它们通常遵循一个模式,即:
新技术+原有产业=新产业
那些有意无意接受了这个规律的企业家,常常在新的时代又站到了浪潮之巅。
第一次工业革命英国人开始采用蒸汽机改造原有产业时,它的GDP还远比不上传统的经济大国中国。但是在广泛使用蒸汽机的同时,英国实际上按照以下思路重新定义了很多产业:
现有产业+蒸汽机=新产业
这一思路使得英国把各个古老的文明都甩在了后面,并且英国当时并不是每一个工厂都在制造蒸汽机。制造蒸汽机的是非常少的几个工厂,大部分是使用蒸汽机改造原有的产业。
到了19世纪末,电的应用改变了世界,其发挥作用的方式和蒸汽机有相似之处。电带来的“第二次工业革命”也遵循着如下定义产业的思路:
现有产业+电=新产业
而“二战”后信息技术带来了新的产业革命,自从1965年摩尔博士提出摩尔定律,计算机处理器和存储器的性能分别提高了2000万倍和10亿倍,价格却不断地下降,以至于它可以被应用到各个行业,以及生活的方方面面。
在过去的半个世纪里,世界进步背后最根本的动力可以概括为摩尔定律的应用,或者说数字化,因此这个时代的经济特点可以概括为:
现有产业+摩尔定律=新产业
我们回顾过去是为了展望未来。今后,由大数据引发的智能革命也将是以一种与前面几次技术革命类似的方式展开,如果我们用两个简单的公式来概括的话,那就是:
现有产业+大数据=新产业
现有产业+机器智能=新产业
所以,从工业革命开始,几次主要的技术革命都遵循相似的规律。首先,是大部分现有产业加上新技术等于新产业。或者说原有产业需要以新的形态出现。其次,并非每一家公司都要从事新技术产品本身的制造,更多时候它们是利用新技术改造原有产业。
这次以大数据为核心的智能革命也不例外,我们将看到它依然会延续这两个特点。每次技术革命都会诞生新的思维方式和商业模式,企业只有在思维上跟上新的时代,才能在未来的商业中立于不败之地。
4. 智能革命和未来社会
机器智能会给人类带来一个终极问题:既然什么事情都可以让机器来做,而且还比人做得好,那么人类怎么办?
4.1 机器抢掉人的饭碗
技术对社会带来的影响有时候非常诡异。一方面它可以改善人们的生活,延长人类的寿命,让一些处在新的行业、掌握了新的技能的人发挥更大的作用;另一方面则可能让更多的人无事可做。智能革命也必然如此,当计算机变得足够聪明之后,一定会取代人类完成很多需要高智力的工作。
人类总体来讲是过分自信的,趋利而忽视危害。当社会面对重大技术革命所产生的冲击不知所措,要两代人才能消除它的负面影响时,大家才开始感叹历史再一次重复。智能革命将比过去历次技术革命来得更深刻,对社会带来的冲击可能是空前的。
历史上影响力可以和正在进行的智能革命相比的,只有19世纪末始于英国的工业革命、20世纪末始的第二次工业革命、“二战”后以摩尔定律为标准的信息革命,一共是三次。
这三次技术革命都有一个共同的特点,那就是它们对当时的社会产生了巨大的冲击,都需要经过大约半个世纪甚至更长的时间才能消化掉。
目前我们正处于“二战”后的信息时代,而从全世界的范围看,消化掉信息革命的冲击波,或许还要更长时间,然而现在大数据和机器智能革命已经来敲门了。
4.2 解决问题只有靠时间
每一次重大的技术革命都需要至少一代人的时间来消除其所带来的负面影响,比如使得很多产业消失,或者产生从业人口大量减少等,造成社会动荡。日本和欧美的解决方案是将这些失业且无法通过二次学习去适应新就业环境的人强制塞到公司里,中国则是“耗”,耗上两代,社会问题就解决了。
那些曾经为人类的文明做出过贡献,但已经被技术革命所淘汰的员工,唯一的希望就是他们的后代能够进入一个新的行业。这实际上是靠时间慢慢地消化技术革命带来的负面影响。
4.3 智能革命的冲击
智能革命将要走的路和历史上历次技术革命的路会有很多相似之处。大数据和机器智能的趋势一旦形成,就不是人力可以阻挡的。
从目前的发展来看,智能革命对社会的冲击甚至有可能超过过去几次技术革命,主要原因有以下三方面:
首先,信息革命本身带来的影响还没有完全消化完。
其次,今天的世界和200年前已经不同了,消化掉技术革命的影响要比工业革命时难得多。
最后,也是最重要的一点,智能革命所要替代的是人类最值得自豪的部分——大脑。
现代社会,很多国家都采用“劫富济贫”的方式,征收富人的税养活穷人,社会的进步抛弃了那些没有跟上时代步伐的人,这几十亿的劳工缺口却无法得到很好的解决,只能任由放任。
在历次技术革命中,一个人、一家企业、甚至一个国家,可以选择的道路只有两条:要么加入浪潮,成为前2%的人,要么观望徘徊,被淘汰。抱怨是没有用的。至于当下怎么才能成为2%,其实很简单,就是踏上智能革命的浪潮。
饺子曰
行文至此,全文6277字,写了3天的这篇文章总算告一段落。如果你能全文看下来,相信必然收获巨大。
记得张泉灵在今年1月份的一个演讲中说过这样一句话:时代抛弃你的时候,连再见都不会说一声。
科技的发展日新月异,这边内容创业、共享经济的风口刚吹起来,人工智能就席卷而来,而人工智能的屁股还没坐热,区块链又横空出世了。面对技术的快速进步,避免自己被淘汰的最好办法就是保持不断学习。谨以此文,共勉。
最后说个题外话,最近书荒,大家有啥想看的书,赶快留言告诉我呀!另外,饺子哥码字很辛苦,看完记得点赞啊!