人工智能现在很热,但是对于很多人来说还是搞不清楚它到底是个什么东西。比如说:
- AI机器人已经能和人类对话了,它是能够简单思考了吗?
- alpha狗在围棋上打败了人类,它是否智商超群并且拥有思维了?
- 机器学习,是机器人懂得学习了吗?
机器好像越来越聪明,我们生活在一个越来越智能的时代,并且,时代只会继续向前推进。这篇文章作为一个小小的科普,已经了解这些的人大可付之一笑。此文仅献给和我一样曾经困惑的人。不讲高科技不讲数学公式,让每个人能看得懂才是此文的意义。
3,2,1,开始。
AI和人类对话是怎么做到的?
1、最简单的方式——关键词回复
最简单的实现方式,作为一个程序员我就要说关键词回复了。如果你不大懂什么叫关键词回复,就去看看你关注的公众号,好多公众号里都会有:回复某些关键词,就可以查看相关信息,对吧~
举个例子,当粉丝在公众号里发“你好”的时候,自动回复“您好呀,欢迎关注xxx”。
关键就在于当程序收到“你好”两个字的时候,就自动回复一句事先设置好的回复内容。类似触发条件,你按哪个灯的开关,哪个灯就会亮起。
2、加入点难度
为啥关键词回复是最简单的?因为条件固定啊!你发送关键词"A",就推给你实现设置好的和A相匹配的信息,发送"B",就推给你和B相匹配的信息。人工智能可不是这样,他能够对话!
那么对话的难度在哪里?
这里我要澄清一个问题,人工智能并不是能够思考,也并没有思维。那么人工智能为什么能像人类一样对话呢?
我是不是已经把你搞糊涂了?那一定是我讲得不够好,希望你还有耐心往下看。
AI没有思维,它之所以能够回答你的问题,并且更进一步和你聊天,实际上还是关键词回复的原理。
对话的难度,其实也是让你感到神奇的地方,是它能够根据一整句话而不是单个的词语(即关键词)来作为回复的依据。
“你好,我叫王小明,今天认识你很开心。”这句话,如果你是一个机器人而不是一个自带聊天天赋的人类,你要怎么回复?按我们刚才说的关键词回复的方法,你是按照“你好”回复呢?还是“王小明”,还是“今天”,还是“开心”来回复?
这里其实我已经在下意识的使用分词了。什么叫分词,就是把语句分成一个一个重要的关键词。
有木有豁然开朗?是这样的呀,你说的是一整个句子,可是机器在处理的时候其实是分成了一个一个的关键词。这样我们重要的关键词就有了,回复才有了可能。
当然和AI的对话涉及到“语音识别”问题,我后面会讲到,其实实现这个技术用了好多年,说起来却很简单的原理。我先卖个关子,其实语音识别和AI与人类的对话,解决的方法是一样的。
继续来说句子的回复,现在我有了多个有意义的关键词。有意义是相对于那些无意义的虚词来说,比如中文中的“的”,“了”,还有各种语气词。有意义的关键词现在有了,下一步,就是给词语标权重。
什么叫权重?
现在玩过狼人杀的人应该很多吧,在把狼人投出去的时候,普通人每人有1票的权利,警长有3票。这个就是权重,普通人的权重是1,警长的权重是3。那么他说话自然更有用一些。
词语也有权重,并且这个权重是人为加上去的,背后是我们叫做"library"的。你可以理解为字典,或者词库。大家的输入法有时候可以选择输入偏好吧,是体育类别的还是互联网类别的,词库会不太一样。互联网里面我们说“数据库”、“服务器”、“AI”、“人工智能”比较多,那体育类的就是“足协”、“比赛”、“赛事”之类的比较多,我不懂体育,瞎编的。
词语有了权重,这时候就可以综合把几个关键词以及他们的权重综合运算,怎么运算我就不细讲了,不是本文侧重点。
于是这时候,AI就能回答你的句子了。
这个时候,其实回复还不是特别的准确和令人满意。想想你最初的sira。
灵魂是——统计
什么?不是在说智能吗?不是在说技术吗?不是互联网吗?你说编程虽然我看不懂但是符合我的逻辑啊,和统计有什么关系?Are you kidding me?
NO!相信我,当初也和你一样懵逼。同时我也要告诉你,语音识别技术的突破背后,其实也是统计学。搜索引擎能够那么贴心的给你几乎最合适的答案背后也是统计学。
大家知道现在语音识别技术已经可以做到同声翻译了,跟专业做同传几十年的人类已经不相上下了。机器并不是拥有比人类更高的智商,它的背后是大量的数据,也就是我们耳朵都听出茧来的“大数据”。大数据为嘛牛?是统计啊童鞋们,因为样本越多统计越精确啊。就是这么简单的道理。
当然道理很简单,做起来却有很复杂的数学公式在起作用,当然还有许许多多的技术人员在技术方便的改善,比如说算法。数据量那么庞大,算法的进步直接影响到处理结果的时间和精确度。
这里引入一个有些人应该并不陌生的词——信息熵。但是并不多讲。
今天只能到这里了,统计的作用在人工智能中是巨大的,我最近正在恶补统计的知识。
我信息的来源是吴军的《数学之美》,从搜索引擎的实现原理,到语音识别技术,背后其实都是统计学。大数据+统计学,才是真正变革我们时代的秘密武器。想要了解的童鞋可以去看一下,肯定比我讲得好。
希望我写的对你有用,当然第一次写又是在深夜,可能比较乱,请见谅。如果能解决你一星半点的疑惑,那么我的目的就达到了。