机器学习中的评估指标

机器学习中需要使用模型,优化,评价,其中评价指标也是用来优化的一环,这里总结一下常用的评估指标,主要分为分类和回归,其中分类指的是二分类,多分类可在此基础上拓展。

分类问题

对于一个二分类问题来说,实例会被分为正例和负例,则根据预测的正确与否会分为四种情况。

  1. TP(True Positive):实际是正类,预测为正类。
  2. FN(False Negative):实际是正类,预测为负类(漏)。
  3. FP(False Positive):实际为负类,预测为正类(误)。
  4. TN(True Negative):实际为负类,预测为负类。

二元混淆矩阵便是用表格的形式表示以上四种情况,能方便的比较预测的正误数。

混淆矩阵

准确率(accuracy)指正确预测的样本数/总数,公式表示为Accuracy = (TP+TN)/(TP+FN+FP+TN)。

精确率(Precision)也叫查准率,只是针对预测正确的正样本而不是所有预测正确的样本。即正确预测的正例数 /预测正例总数,公式表示为Precision = TP/(TP+FP)。

召回率(Recall)也叫查全率,表现在实际正样本中,分类器能预测出多少,即正确预测的正例数 /实际正例总数,公式表示为Recall = TP/(TP+FN)。

F1Score是precision和recall的调和平均值,更接近于两者中较小的那个。公式表示为2/F1 = 1/Precision + 1/Recall。不过更一般的用法是加权调和平均,即对于precision和recall分别取不同的权值。

真正率(True Positive Rate,TPR):TPR=TP/(TP+FN),即被预测为正的正样本数 /正样本实际数。
假正率(False Positive Rate,FPR):FPR=FP/(FP+TN),即被预测为正的负样本数 /负样本实际数。
假负率(False Negative Rate,FNR) :FNR=FN/(TP+FN),即被预测为负的正样本数 /正样本实际数。
真负率(True Negative Rate,TNR):TNR=TN/(TN+FP),即被预测为负的负样本数 /负样本实际数。

PR曲线的横坐标是精确率P,纵坐标是召回率R。显然精确率和召回率都是越大越好,即在上方的曲线比下方的曲线好。当精确率和召回率接近时F1Score最大,因此也可以直接找F1score的最大点(只需要画直线y=x)。

image.png

ROC(Receiver Operating Characteristic)曲线在对于正负例的判断中,我们会设置一个阈值,当大于这个阈值则为正例,小于这个阈值则为负例,根据不同的阈值,采用横坐标为False Positive Rate(FPR假正率),纵坐标为True Positive Rate(TPR真正率),便可做出ROC曲线。对角线对应的是随机猜测的表现,一般曲线越接近左上角,则分类器的性能越好。

image.png

AUC(Area Under Curve)为ROC曲线所覆盖的区域面积,显然,AUC越大,分类器分类效果越好。当AUC=0.5,则表示为随机猜测,没有预测价值,当AUC>0.5优于随机猜测,当AUC<0.5比随机猜测还差,但只要反预测便可优于随即猜测。AUC曲线的物理意义为,任取一对(正、负)样本,正样本的置信度大于负样本的置信度的概率。

代价敏感指的是不同的错误具有不同的权重,即将正例预测为负例的后果与将负例预测为正例的后果不一致。如在体检时,将生病的情况预测为健康的危害大于将健康的情况预测为生病,体检的时候如果把正确率直接设置为100%,则与实际情况很接近,但这并不是我们想要的,我们需要的是找出其中的病人,因此需要将这两种情况赋予不同的权重。

回归问题

回归问题的评价指标通常有MSE,MAE,RMSE,R-Squared。

MSE(均方误差),就是线性回归的损失函数,也就是最小二乘法的目标函数,容易理解。

image.png

RMSE(均方根误差),顾名思义,这就是MSE开方根,实质也一样,不过对于很大的数据可以较好的比较。

image

MAE(平方绝对误差),作用类似于MSE,只要想到最小二乘法就好了。

image.png

R-Squared(决定系数),值为0-1之间,越接近1,则表示对数据拟合得越好。
总平方和为

image.png

回归平方和


image.png

残差平方和


image.png

根据以上定义,决定系数可定义为
image.png

在这里总结了分类和回归的几个常用指标,但是实际的使用要根据实际情况来改变指标的使用,要重新创造或者略微修改。关于聚类评估指标的总结下回再写。

欢迎大家关注公众号“计算机视觉与机器学习”


计算机视觉和机器学习
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,340评论 5 467
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,762评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,329评论 0 329
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,678评论 1 270
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,583评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 47,995评论 1 275
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,493评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,145评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,293评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,250评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,267评论 1 328
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,973评论 3 316
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,556评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,648评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,873评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,257评论 2 345
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,809评论 2 339

推荐阅读更多精彩内容