在这篇文章中,主要介绍了多项式的次数d和过拟合以及欠拟合之间的关系,
如上图所示,我们可以得到如下结论
1.高偏差(欠拟合) 训练误差和验证误差都很高,
2.高方差(过拟合)训练误差很小,验证误差远大于训练误差
从图中我们可以得到如下结论:
1. 训练数据量少:训练误差很小,验证误差大
2.训练数据量大:验证误差和训练误差都很大,两者差不多相等
3.如果学习算法遭受到高偏差,get more training data will not help much.
结论:
1. 低数据量:训练误差很小,验证误差大
2.低数据量:训练误差值慢慢增大,在某个值之前,测试误差一直减小。并且训练误差小于测试误差,而且这个差异比较明显。
3.If a learning algorithm is suffering from high variance, getting more training data is likely to help
参考文献:
机器学习,吴恩达课程