前言
SVM
支持向量机(SVM)是一个有监督的机器学习算法,可以用于分类和回归分析,最主要是用于分类问题中。根据特征值,构建一个n维空间(n为特征数量), 把每个数据点投影到此空间内。
数据分类
查找一个超平面,把数据区分成两类。算法输出一个最佳超平面,用于数据分类。
最佳超平面:距离两类数据最远的一个超平面。即此超平面到达最近元素的距离在所有超平面中是最远的。
调整参数
核函数(Kernel)
学习线性SVM的超平面就是通过线性代数转化问题,这是核函数的功能。多项式和径向基用于更高维度。
系数(Gamma)
系数定义了单个训练集合的影响程度。小的系数值,距离远的点也会用于计算,大的系数值,更多使用距离近的点。
正则化(Regularization)
对于较大值的此参数,如果这个超平面可以更好的区分训练集合点,最好选择一个较小间距的超平面;相反的,对于非常小值的此参数,需要使用更大的间距,即使此超平面误区分更多的点。
间距(Margin)
间距指的是到最近点的分界线。
一个好的分解距离两类数据更远,且可以把一类的点区分开,而不需要穿过另外一个类。
初步笔记,将继续整理丰富