如果你渴望奇迹,那么机器学习对你来说是一场精神盛宴。我诚挚的邀请你一同前往。
我为什么总是要读这些人工智能、机器学习的书,不仅仅是为了学习到相关知识,更重要的,是可以增强斗志、强化信念,增加自己对于机器学习和人工智能的兴趣和自信。
我自认为生活在一个好的时代,从事了这样一个非常棒的行业,尽管有太多的缺点:人傻钱多死得早,但是,能够为世界创造出真正有意义的东西的机会,并不是每个人都有的。
最重要的是,机器学习所表现出的神奇,不亚于第一次看到电视机里可以出现人影一样。还记得小时候我总是跑到电视机后面去看看到底发生了什么。
很显然,那时候我并没有意识到,那是电视机播放的影像。我也不知道具体发生了什么。而机器学习带给我的震撼也是如此。
这里有一个概念,知识与技能,知识是死的,例如北京有多大?上海GDP是多少?这就是存储的一个个数据,目前计算机可以做的很好。但是另一方面,就是技能。例如开车,例如作画。这种是一种行为,在计算机里,是被描述成程序。它是动态的。
我们现在一直说,机器学习,那么机器究竟是如何学习?机器的学习是弱学习,怎么这么说。例如,我们要学下面条,我们已经大概知道大致的流程,例如,先放上水,过一会再下面,然后再过一会,我们放佐料,例如盐、味精等等。然后,机器如果学下面条,学的是什么呢?它不是学这个流程,而是学水的量,烧水的时间,水开了多久下面,面要下多少,再煮多少时间,放什么样的佐料,学的是这些。
因此,它并没有真正的学习下面条这样一项技能,而仅仅是精确了下面条各项步骤。当然,我这样说,似乎不是太合适,但是有一点,目前的冯诺依曼架构的计算机只允许修改数据,而不允许修改算法本身,也就是说,它并不能修改它自身的编码。
如果明确了这一点,我们那些基于美国大片的担忧,就基本上可以不用存在了。曾经我举了例子,说如果是让一个超级电脑来计算pi的值,它可能会杀掉所有生物,占领整个宇宙,但仅仅只是为了让pi的值更加精确。
但事实上,就目前的机器学习的框架而言,这种情况并不会存在。因为它的目标函数未改变的情况下,它的行为是有限的,是由它的行为编码所控制的,它并不能改变自身行为的编码。这既是我们的幸运,也是我们的不幸。
我们举个例子:
如果开一家公司,那么公司的产业要分3步:
第一步是个体户,所有行为,老板亲力亲为,就像路边店里的馄饨一样,老板自己知道常来客人的口味和喜好。
第二步是小公司,所有行为,老板自己顾不来了,于是就雇佣员工,建立数据库,来记载所有客人的口味和喜好。
第三步是大公司,用户实在是太多了,根本没有谁能够总结出所有客人喜欢什么,不喜欢什么。这时候就需要机器学习从大量的样本中,获取到有用的但又潜在的关系。为接下来的顾客来服务。
我们再来举个例子:
机器学习可以用来管理人事么?在公司里的认识晋升,在企业中的招聘人才,可以使用这种方法吗?理论上讲,是可以,但是困难有这么几个方面:
- 用人本来就是和领导的主观思考有关系,可能出现用人不当,但是有主观爱好的,例如主管是雷厉风行,则可能更喜欢雷厉风行的下属等等。
- 训练数据过少,就算是很大的企业,也不过几万人,流动数目一年大概只有几百人(BAT),数据量太少,预测出的结果不一定对。
现在的时代,除了人才是重要的,另一方面是数据,只要有了数据,就可以让机器习得很多有用的技能。像京东万象就已经开始在卖数据了。
这类似于前几年的数据挖掘,但是现在流行语,叫做机器学习。下面我们开个头,简要的介绍一下机器学习的5个学派:
- 符号学派:符号学派将学习看作是逆向演绎,并从哲学、心理学、逻辑学中寻求洞见。其主算法是逆向演绎
- 联结学派:联结学派是对大脑进行逆向分析,灵感来源于神经科学和物理学。其主算法是:反向传播。
- 进化学派:进化学派在计算机上模拟进化,并利用遗传学和进化生物学知识。其主算法是:遗传编程。
- 贝叶斯学派:贝叶斯学派认为学习是一种概率推理形式,理论根基在于统计学。其主算法是:贝叶斯推理。
- 类推学派:类推学派通过对相似性判断的外推来进行学习,并受心理学和数学最优化的影响。其主算法是:支持向量机。
在日常的学习中,难免有困难,有挫折,有艰苦的时候,有绝望的时候,这时候,都是靠着自身对于这份事业的热爱和忠诚,让我相信人工智能终将能够成功。我愿意为这份事业奉献自己的一生。