AlphaGo真的战胜人类了吗?

今天,引人注目的人机大战终于以4:1的悬殊比分,宣告了AlphaGo赢得了比赛,看起来计算机相当的强大,就围棋这个领域来讲,已经完全战胜了人类,那么我们不禁要问,计算机战胜人类的原理是什么?他们真的具备跟人类匹敌的智商吗?

大概在10多年前,我曾经写过一个中国象棋的AI项目,当时并没有利用分布式计算(那时也不懂),只是一个单机程序,大概能有6-7步的预测能力,经过不客观测试,能战胜我能接触到的所有象棋爱好者。当时人机博弈理论的基础就是Alpha-Beta搜索:

Alpha-Beta搜索实际上是从最简单的BFS搜索和之后的A*搜索发展来的,BFS其实就是最简单的穷举,每层都把所有的可能列出来,最后给一个结论,而A*搜索在这个基础上,多了一个选择函数,即在每层遍历时,给一个优先级,优先从看起来局部最优的方向入手遍历,比如我们在地图上设计寻路的机器人,可以设定NPC周围所有8个节点方向上,最指向最终目的地的方向的节点是看起来最优的,然后从这个节点优先遍历。

Alpha-Beta搜索,实际也借鉴了A*的思想,即每次都从局部看起来最优的结果给出下一步的判断。首先,我来解释一下什么是局部最优:

因为以目前计算机(尤其指单机)的计算能力,是无法遍历棋盘所有可能的,以围棋为例,19*19的棋盘上,一共有361个点,也就是执黑先行者有361个选择,之后执白有360个选择,于是361*360*359....,这是一个比天文数字还大的数字,所以我们根本不可能通过计算得到全局最优。

判断棋局的优劣

那么,我们怎么评价某一种走法看起来最优呢?这就需要根据不同的棋,设定规则了,以中国象棋为例:

某个残局

规则1,我们规定,自己一方所有子能走的区域越大则越优,说俗点,别把自己给“闷死”了,比如                  马走到边上。于是给定一个棋盘,我们可以计算:

V1= 马可走的区域+车可走的区域+兵可走的区域+帅可走的区域+....

V越大,则越优秀

但是,下过象棋的人都会觉得,规则1也太简单了吧,完全没考虑到车和兵在棋盘上的重要度完全不一样,不能按照一个权值系数算,另外,规则1完全没考虑到对对手的威胁性,于是,我们进行改进:

V2=系数A * (系数1*马可走的区域+系数2*车可走的区域+系数3*兵可走的区域...) + 系数B * (自己的马有可能吃掉对方的子的重要度+自己的车有可能吃掉对方的子的重要度+自己的兵可以吃掉对方的子的重要度...)

大家能明显的看到,V2比V1合理多了,不仅仅考虑到了自己的字别被“闷死”,还考虑到了对对方的威胁,那么这个公式还能不能改进呢?还能!我们知道,对对方的威胁,对帅的威胁是最高的,对车的威胁完全高于对兵的威胁,说俗一点,就是能吃掉对方的帅,绝不吃掉对方的车,能吃掉对方的车,绝不吃掉对方的兵。

于是,这个公式就V3就更复杂了,系数也越来越多,这里我们得出一个结论:

我们一定一个得到一个公式,它较公平的判断一个棋局,对某一方的优劣是什么,且这个优劣还是可以量化的!当然,对于围棋而言,这个公式更麻烦一些。

但这里我们忽略了一个问题:即最终的公式有N多的系数,我们需要一种办法来确定最优的系数组合。

Alpha-Beta搜索

当双方博弈时,当下一步该自己走时,只需要遍历所有的下一步可能,然后选择一个棋局对自己最优的方案即可,这个非常简单,但是,这仅仅代表计算机有预测一步的能力,按照这个逻辑设计出来的程序可能连小孩都打不过,要想战胜人,需要有提前预判N步的能力。那么怎么预测两步呢?

我们可以遍历所有的下一步的下一步的可能,因为下一步的下一步是对手下,所以我们只需要从所有可能中选择让对手最难受的一种可能即可。于是,按照这个思路,我们就产生了两个约束条件:

A:对自己最有利

B:让对手最难受

如果我们在搜索过程中,不断的以这两个约束条件去进行搜索,这就是Alpha-Beta搜索。两个约束条件更符合博弈的本质,即对自己最有利且不断限制对方。Alpha-Beta算法本身也很简单,可自行Google。

看起来AI下棋的原理不难,但其实真正的奥秘就是如何减少搜索的计算量。

核心:减少计算量

从之前的描述,我们可以看出,计算机算的越快,赢的概率越大,那么怎么算的更快呢?更好的硬件+分布式并行是一种思路,当然从算法上能减少计算量则更好!减少计算量的办法至少有这么几种:

1,其实每步下棋时,没有必要棋盘上所有点都考虑,而是可以优先考虑某些点,比如离目前棋子比较近的点,这样就能减少相当一部分工作量。

2,录入相当多的棋谱,这样可以避免搜索一直到叶子节点,如果匹配到棋谱的话,可以从之前很多步就提前返回。

3,赋予计算机一种神奇的能力,让他能够有预感,预感到某一步可能“有戏”,这样把这一步放到Alpha-Beta搜索队列的前面,优先搜索,这样避免把计算资源浪费在其他“没戏”的下一步上。

而3,也是根据AlphaGo公开出的资料中,最高深的一点,即所谓的CNN,应用在蒙特卡罗搜索MCTS中,从而把有限的计算能力计算值得计算的子节点。这一点在围棋中尤为重要(更尤其在初盘中盘,因为末盘的搜索量会急剧减少),能做好这一点才是让围棋AI能够战胜人类高手的关键。

那么按照公开资料,AlphaGo是根据CNN卷积神经网络来训练AI的,输入就是19*19的棋盘信息,输出就是一个value,量化的代表对谁有利,通过输入成千上万的高手棋谱,经过反复的自学习,确定神经网络的参数,最终可以实现给定任何一个棋局,判断其是否对自己有利,这样就可以在每次Alpha-Beta搜索计算前,把待搜索的布局排序,优先搜索那些对自己有利的布局,从而大大缩小计算量。

3层神经元网络

神经元网络大多都依赖梯度下降,即误差反传BP,举个通俗的例子,一个盲人登山,要寻找山的最高点,他所能做的,就是不断的往前或者往后迈,不断收集前后两步的高度差值,如果高度差很大,就反馈给大脑加大步伐,如果高度差越来越小,就反馈给大脑减小步伐,最终直到前后两步的高度差一样了,也就找到最高点了(其实是局部最高点)。这个比较好理解,但是为什么卷积的神经网络适合围棋这个场景,这里面是数学理论的推导依据还是先有模型不断经验测试的结果,只能靠进一步研读Google的资料来寻找答案了。

机器战胜人类了吗?

从上面的浅显分析可以看出,即使AlphaGo将来可以战胜柯洁大棋渣,其整个运算过程其实跟围棋艺术本身没任何关系,包括是最神秘的那个CNN里面的层级、参数关系,也很难说明他们跟人类的思考模式有相似的关系。我总感觉,这种AI只不过是用计算机的逻辑在某一个“固定的、可言传的”规则上计算能力超过了人类。

但我们现实生活中,“不固定的、不可言传”的事务比比皆是,怎么谈生意、怎么忽悠投资人、怎么跟领导汇报、怎么泡妞。。。这些都无法用固定规则来描述,换句话说,即使给出再大的计算能力,也很难给出上面这些事的“棋局优劣函数”,同时也无法找出一个CNN网络来评估训练这些事,因为他们的输出根本就是不是离散的。

所以,我觉得目前的AlphaGo距离真正的人类智商还相差太远,等什么时候,计算机能够做到察言观色、洞察秋毫,能够像电影“机器姬”迷惑人类时,才能算是真正的人工智能!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容