对监督学习的理解

机器学习分为监督学习，非监督学习，强化学习和深度学习。

监督学习，是从标记的训练数据来推断一个功能的机器学习任务。

比如，在家里教宝宝认识苹果和梨，你拿出四个苹果和四个梨，放桌子上教宝宝认识这些水果。这些苹果和梨就是已经标注好的数据。

然后指着苹果对宝宝说：“来，宝宝，往这看，这是苹果，来跟我念，苹——果——。”

“苹——果——。”

“好。”

然后又指着香蕉对宝宝说：“来，看这里，这是梨，来给我念，梨——。”

“梨——。”

依次把这些水果都教宝宝认一遍。这就是监督学习的训练过程，训练完成后还要做一下测试，看看宝宝是否都学习会了。

监督学习中，一般把数据分成两部分，一部分是学习数据，占总数据集的80%以上，一部分是测数据，占总数据集的20%一下。测试时，你从冰箱里拿出一个苹果和一个梨，问宝宝：“宝宝，这是什么呀？”。这就是监督学习的测试过程。

在测试中，宝宝把苹果认错了，你分析发现，原来你教宝宝的时候用的是红苹果，测试时，用的是青苹果。这说明你对数据划分的不合理，训练数据中应该包括红苹果和青苹果。

为了避免这个问题，在训练时，先把数据随机打乱，再把数据分成训练数据和测试数据。

其实在真正的监督学习中，学习过程类型与上面说的类似，只是在学习时，使用了一些算法，数据量级也是上百万，上千万，甚至上亿的。

为了训练出更好的机器学习模型，我们会先选择一个合适的机器学习算法，再为这个算法准备好不同的参数。

在训练时，我们把学习算法和参数结合起来，组合成一个模型。为选出一个最好的模型，我们会使用一些交叉验证法，计算出一个得分，哪个模型得分高就选哪个模型。

交叉验证法有很多种，我们一般使用K折交叉验证。K折交叉验证是把训练数据分成K份，然后依次拿出一份做为验证数据，其剩下他的K-1份数据做为训练数据，用来训练机器学习模型，训练完成后，再拿验证数据，测试模型得分。这样循环执行K次，然后再把每次验证得分加一起算平均值，作为模型的得分，得分最高的模型，就是我们选取的模型。

然后再用测试数据测试我们选取的模型，看看它的正确率怎么样。

有时我们在训练时，得分很高，但是在测试时，正确率却很低。我们把这种现象叫过拟合。过拟合出现的原因是训练条件太苛刻了。比如，你在教宝宝认苹果的时候，拿出一个红苹果，对宝宝说：“宝宝，这是苹果，它的颜色的红的，上面还有个把。” 然后你再拿出来一个红色没把的苹果，他就不认识了。因为你教他的时候，条件太苛刻了，红色带把的苹果叫苹果。这就叫过拟合。

出现过拟合，那么我们就需要，调整参数，再重新训练。找到最好的模型，然后测试。直到测试的正确率满意为止。

无戒365挑战营 42

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,098评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,213评论 2赞 380
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,960评论 0赞 336
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,519评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,512评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,533评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,914评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,574评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,804评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,563评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,644评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,350评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,933评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,908评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,146评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,847评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,361评论 2赞 342

对监督学习的理解

推荐阅读更多精彩内容