机器学习策略(1)

假设你在做一个猫的分类器,训练准确度达到了90%,现在还想继续提高,你可能会有以下的想法:



所以我们需要知道哪些是可以尝试的,哪些是可以放心舍弃的。
搭建机器学习系统挑战之一是:你可以尝试和挑战的东西太多。

正交化


改变一个参数或变量只影响一个方面——正交化

  • 如果你的算法在成本函数上不能很好的拟合训练集,你可以训练一个更大的网络;或者选用一个更好的优化算法,比如。
  • 如果对开发集(验证集)效果很差,希望去调整尽量不影响到训练集效果。增大训练集是一种方法
  • 如果在开发集上效果很好,在测试集上效果不行,说明你对开发集过拟合了,你需要往回退一步,使用更大的开发集
  • 如果在测试集上,但不能部署良好的体验,这意味着你需要回去改开发集或成本函数。

单一数字评估指标

查全率和查准率可以用单一的F1值



或者下图的平均误差


设立满足和优化指标


如果我只是要求响应时间小于100ms的话,应该选择第二种。

训练/开发/测试集划分

将所有数据放在一起随机洗牌放入开发集和测试集,所以开发集和测试集都来自八个地区的数据,并且开发集和测试集都来自于同一分布。
这里有一个真实的故事 :


训练/开发/测试集大小

什么时候改变你的开发/测试集指标

  • Eg1

算法A误差只有3%,算法B误差5%。算法A可以看到更多猫的图片,但会让一下色情图片通过,,这一点完全不能接受;算法B有5%误差,这样分类器就得到较少的图片,但不会推送色情图片。所以从公司以及用户的角度来看,算法B实际是一个更好的算法。A在评估指标上做的更好但实际上是一个更糟糕的算法。在这种情况下,评估指标加上开发集它们都会倾向选择算法A,但你和你的用户更倾向使用算法B。当这种情况发生时,你的评估指标无法衡量算法之间的优劣排序时,这就发出信号,你应该改变评估指标了或者改变开发集和测试集。



解决办法就是对你的误差加入一个权重因子惩罚项。

处理机器学习问题时,应该把它切分成独立的步骤。1.弄清楚如何定义一个指标来衡量你想做的事情的表现 2.考虑如何改善系统在这个指标上的表现

  • Eg2



    如果你的开发测试集都是些高质量图像,但在开发测试集上做的评估无法预测你的应用实际表现,因为你的应用处理的是低质量图像。那么就应该改变你的开发测试集,让你的数据更能反映你实际需要处理好的数据。
    总体方针就是,如果你当前的指标和当前用来评估的数据和你真正关心必须做好的事情关系不大,那你就应该更改你的指标或者你的开发测试集,让它们能更好地反映你的算法需要处理好的数据

贝叶斯最优误差

理论上可以达到的最优误差,就是说没有任何办法设计出一个x到y的函数,让它能够超过一定的准确度。


对于语音识别系统,如果X是音频片段,有些音频就是这么嘈杂,基本不知道说的是什么,所以准确率不可能是100%。
事实证明,机器学习进展往往相当快,直到超越人类的表现之前一直很快。当超越人类表现时,有时进展会变慢,有两个原因:1.人类水平在很多任务中离贝叶斯误差已经不远了,人们非常擅长看图片或者听音频。 2.只要你的表现比人类的变现更差,那么实际上可以使用某些工具来提高性能,一旦超越了人类的表现,这些工具就没那么好用了。


可避免偏差

贝叶斯误差和训练误差之间的差值

人类水平表现

人类水平误差可以用来估计贝叶斯误差

  • Eg1


以上四种情况哪一种可以代表人类水平误差呢?
因为人类水平误差可以用来估计贝叶斯误差,所以我们知道贝叶斯误差不会高于0.5%,所以这里我们将人类水平定义为0.5%。
定义人类水平误差时,要弄清楚你的目标所在,如果要表明你可以超越单个人类,那么就有理由把第二种情况作为人类水平误差。但是如果你的目标是代替贝叶斯误差,那么第四种才是合适的。

  • Eg 误差分析


如何提高算法性能指导方针

想让一个监督学习算法达到实用,基本上希望或者假设你可以完成两件事情:1.算法对训练集拟合很好,意味着可避免偏差很低。2.在训练集中很好,然后推广到开发集和测试集也很好,意味着方差不要太大。



最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 201,924评论 5 474
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,781评论 2 378
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 148,813评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,264评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,273评论 5 363
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,383评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,800评论 3 393
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,482评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,673评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,497评论 2 318
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,545评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,240评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,802评论 3 304
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,866评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,101评论 1 258
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,673评论 2 348
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,245评论 2 341