智能和学习
自然界的智能
霍金:Intelligence is the ability to adapt to change.
生存游戏
自然筛选
大自然中的生物个体会被外部环境刺激而做出相应的行为(环境刺激→个体行为的映射f)。不能对外部环境做出正确行为的个体会死亡,可以对外部环境做出正确行为的个体能够存活。那么造物主可以通过随机生成大量个体,每个个体对外部环境刺激做出不同的行为,总会有个体可以做出正确的行为而存活。(存活的个体拥有一种可以生存的映射f)
环境变化
大自然中的环境会不断变化。即便个体之前幸运地拥有可以生存的映射f而存活,但是在下一次环境变化的时候,这种映射f可能并不能够适应新环境,那么它还是会被筛选掉。如果还用随机生成的方式,那么生命只能在最初的阶段停留片刻,无法进入到下一个阶段。因此,生命想要延续就需要一种能力:可以适应变化的能力,这也就是霍金对智能的描述。
繁殖
于是大自然靠大量的个体不断地繁殖,并且在繁殖过程中并非完美地复制,而是会产生变异。变异的个体有机会适应变化后的环境,从而存活下来;而无法适应环境的个体会被筛选掉。筛选下来的个体继续大量繁殖,产生差异性来迎接下一次环境的筛选。筛选后的结果便是进化,进化出适应当前环境的个体(可以生存的映射f)。
繁殖→变异→筛选
这种繁殖、变异、筛选的动态循环就可以形成相对稳定存在的生命。游戏的关键在于:映射f的更新速度 > 环境的变化速度。所以自然界很多生物大量繁殖的行为并不浪费,它增加了可供筛选的样本数量,防止环境变化后个体全部被筛选掉。
小结
通过对上面的关系进行梳理总结,我们可以得到以下结论:
- 进化是智能映射f的更新。进化的不是个体也不是基因,而是智能映射f。个体的生死对种群只是起到了一次更新的作用,而基因相当于硬盘,存储于上面的智能映射才是核心。进化的过程就是智能映射不断被筛选的过程,筛选出符合当前环境的映射。
- 进化就是学习。进化的动态过程就是寻找智能映射f的过程,是一种以种群为单位的学习方式。
- 智能是适应变化的能力。智能的核心部分有:学习(映射f的寻找 自然选择)、执行(映射f的应用 蛋白质)、延续(映射f的存储 基因)。
- 智能的增强:迭代。单个蛋白质能够完成的任务十分有限,为了增加适应变化的能力,大量的蛋白质组合在一起,并行工作,这就达到了细胞层面的智能。同理,大量的细胞形成组织、器官、系统、个体、聚落、国家……越往上其能够完成的任务就越复杂。自然界无法产生特别复杂的智能,高等智能都是由低等智能迭代生成的。
生活中的学习
高考学习
我们从小学到高中苦读12年是为了什么?为了考上好大学。那考上好大学又是为了什么?为了找个好工作。多数人都会这样回答。
其实思考的顺序应该是反过来的:找到好工作的前提是能够胜任这份工作,胜任这份工作的前提是能够解决工作中遇到的问题。
解决问题
我们遇到一个问题时,通常是应用自己已经掌握的方法,获得一个预测,但是这个预测的结果不一定正确,我们希望可以利用已掌握的方法得到正确的预测,但是方法并不能凭空产生,需要从以往的经验中学习,找出问题和答案之间的正确关系。应用是用问题和方法来预测答案,而学习是用问题和答案来获得方法。获得方法才是学习的目的,才是我们每天上学的目的。比如我们从大量历年的高考真题和其对应答案中学习某个问题的解题方法,学习的目的是希望学到一个能解决高考中任意该类问题的方法。可在高考之前,我们并不知道我们学到的方法是否有效,所以需要模拟考来测试,用已经学到的方法来预测模拟问题的答案,通过和模拟答案的对比得出考试分数,从而衡量学习的有效性。而决定一切的并非是否可以解决学习时所用的旧问题和模拟题,而是最后需要可以正确解决高考题。然而高考也只是验证自己所学方法有效性的一次模拟,不同之处在于,高考这次模拟的结果是给他人参考而用的,各个大学和企业会用该次模拟的结果来判断我们所学方法的有效性,来判断我们将来解决问题的能力,更多的是判断我们的学习能力。
上述过程是高考的学习,也是机器学习中的监督学习,是指有明确答案可供寻找问题与答案之间关系的学习方式。不过以上的概念在机器学习中有了新名字:描述问题与答案之间关系的方法叫做模型,学习问题与答案之间关系的过程叫做训练,解决问题的过程叫做预测,衡量模型好坏的过程叫做评估,训练所用的问题和答案叫做训练集,评估所用的问题和答案叫做测试集,训练集和测试集都是数据,需要提前搜集。而当前人工智能的核心,也就是把我们从小学到高中做了12年的事情搬到计算机上来做,最终的目的是希望得到一个可以解决该任务下任意新问题的模型,也就是:用数据来训练出模型,并再应用。(数据→学习→模型→应用)