NO8《技巧》·中·Why-落日萧峰
【R】P104锻炼你的大脑·机器学习:模型+数据量
机器学习主要有两个东西,一个是模型,另一个是数据量。当你选对了足够的语料、足够的数据量的时候,这个模型会越来越好。
我一直在想我们的大脑一个什么东西。大脑其实是一个反馈的流程,大脑接受了一定的数据、一定的训练,形成了一定的理论,然后不断的去验证这些理论对不对。一个聪明的人大脑结构应该非常地清晰。
为了学英语练听力,我开始听一些Podcast,一开始我发现我听得不太懂,但是由于是自己领域内的东西,后来我都能听得懂;于是我开始听一些经济学的东西,发现一个有十几个字母的词我也能够听懂,我到现在都不知道那些词怎么写,但是我就是能够得懂。
现在我验证了大脑是一个有无穷力量的机器,那我怎么去训练它呢?我觉得听力有一定水平了,那我能不能够说英语呢?于是我就去参加上海老外的聚会,从一句话不会说到能够和老外争论宗教的问题。
我始终觉得我的词汇量是一个问题,那我又开始读英文书,现在我可以看哲学等比较艰涩的书籍了。那后来我发现我要练口语的一种方法,原来一开始我要培养即使看不懂也能读下去的一种感觉,现在我遇到每一个不会的单词都要查,于是我感觉我的口语又在慢慢进步。
【I】重述知识
[What]什么是机器学习?
机器学习是一门人工智能的科学,是研究如何使用机器来模拟人类学习活动的一门学科。本质上机器学习和人类学习非常像。
在讨论机器学习之前,我们来先看看人类是如何学习的。如下图的上半部分所示,人类通过阅读、查阅资料、观察得到信息,这些信息经过人脑学习,最后习得了某种技能。机器学习和人类学习类似,只不过机器学习的输入是数据(Data),输出的结果叫模型(Model)。从数据中学得模型这个过程通过执行某个学习算法(Learning Algorithm)来完成。
- 数据(Data)
- 学习算法(Learning Algorithm)
- 模型(Model)
是机器学习的三个要素。
[图片上传中。。。(1)]
机器学习的原理
先说说人类学习的例子,我们小时候学数学,刚开始用课本上的例题,老师通过演示演绎的方式,让我们知道加减乘除大概是怎么回事,然后给我们一本习题集,不断的去演算,对照标准答案,最终学得四则运算的技能。
刚开始写字的时候也是,叫我们简单的笔画和简单汉字,让我们不断的练习写,知道点横竖撇捺折弯钩,不断的练习,老师修正,最后学会写字的基本功,再碰到不认识的字的时候也知道如何写。
在这个过程中,例题和练习就是训练样本,通过训练样本获得标准答案和符合规范的字的过程,就是“训练”。训练的目的就是找到一个“目标函数”或者书写规则。有训练样本,通过训练找到目标函数和书写规则,这就是机器“学习”的方式,它和人类学习是非常相似的。
[How]怎么运用机器学习?
机器学习其实是在模拟人类学习的过程,是在不断输入数据过程中迭代学习算法并不断调整数据模型,机器学习的速度之所以快是因为数据量足够,从刚开始单一的学习算法会进化迭代出不断优化到准确的算法,而生成模型;
作者举了自己学习英语的例子,我回想自己学习英语到现在的状态,其实就是数据量不够,训练的不够;我们把优秀人的算法和模型拿过来,但是给大脑输入的数据量不够,训练的样本不足,没有在实践过程中去优化算法,也就没有形成自己的模型。
英语不会说就是说的太少了,英语读不懂就是读的太少了,拆书RIA便签学不会就是拆的太少了,有了拆书的R便签、I便签、A便签的标准还是写不好就是拆的太少了,积累了一定的数据量,结合拆书家的指点反馈,及时调整优化改进,再持续练习,就学会了拆书法,学以致用。
大脑是个反馈流,在过程中的及时反馈会给大脑的神经回路留下痕迹,反馈的越多越及时,大脑留下的回路就越粗,链接越紧密,大周期的重复练习,给大脑足够的数据,不断的及时反馈,给大脑及时优化的算法,最终就能形成自己的模型。
[Why]为什么要用机器学习?
1、机器学习是模拟人类学习活动,但人类没有让自己的大脑这个无穷力量的机器得到足够的数据量,没有给大脑及时有效的反馈信息,自然就算是学到思维模型,缺乏大周期的重复练习和刻意练习,也没有用;
2、机器学习和人类学习本质的区别就在于数据量的多少、学习算法的迭代速度,给自己的启示是逐步增加数据量,尽可能的迭代速度
【A1】内化知识
①成功案例:
回想起当年高中背英语单词的时候,那时候我的词汇量就已经达到六级词汇量,以至于大学都没有怎么背单词,那时背单词就是背的多,用各种方法背,后来就背字典,都是给大脑输入了大量的数据,大脑自动的会进行分类,词根汇总,直到现在很多的词汇我都还能知道什么意思;
自己在大学时是记忆与思维协会的会长,后来开始记忆训练,数字训练和扑克牌训练,通过大量的数据输入,自己就不断的优化了记忆方法和记忆组块,用的编码更简单而翻译出来的信息更多,这就是学习算法的优化迭代;
自己跑步能跑到半马,也都是前期积累了足够多的跑量,不断的让自己的身体适应,是有了大量的跑量输入,身体开始不断调整适应,知道如何跑才能跑的更舒服更持久;
②失败案例:
自己的英语口语一直是我不想提及的,没有认真的学,没有坚持的学,也没有足够多的训练,所以就荒废了,不是自己的智力有问题,而是自己缺乏了大周期的重复的练习和训练;
2014年就开始写微信公众号,其实如果坚持写下来,自己现在也能有很多的粉丝,也还是输入的数据量不够,输入的练习量不够,也没有找到迭代优化的算法,自然也没有提炼出来的结构模型、思维套路
【A2】应用知识
1、对于阅读,自己现在基本平均一天能输入2本左右“每天听本书”的精华信息,自己的很多的观念思路都得益于自己从高中、大学一直到现在的大量输入量,还要持续的做这件事,自己在进行关键字搜索、主题搜索、信息链接的时候,都能让自己快速的和大脑中的网络进行匹配,虽然这个网络之间的连接有些薄弱,网架有些松散,但不重要,这些松散的网架里已经逐步开始内化核心知识网络结构,每天听本书+检视阅读+主题阅读+拆书法RIA,这件事还是会始终贯穿终身学习过程中;
2、对于RIA便签拆书法,自己一定要拆到足够多的数量,先完成这30拆,每天一拆,下次还要训练营还要继续参加;