这是《算法图解》第十篇读书笔记,内容主要是K邻近算法的介绍。
1.K近邻算法简介
K近邻算法(K-nearest neighbor)是一个给定训练数据,根据样本数据最近的K个实例的类别来判断样本数据的类别或数值的算法。该算法可细分为两种类型:判断样本类别的分类算法,计算样本数据的值的算法。
2.python实现方式
可用python的scikit-learn包实现K近邻算法。
调用包的方式如下:
from sklearn import neighbors
#K近邻算法的分类算法
classifier=neighbors.KNeighborsClassifier()
#K近邻算法的回归算法
regressor=neighbors.KNeighborsRegressor()
3.K近邻算法的优缺点
3.1优点
(1)可处理分类问题和回归问题。
(2)适合大样本情况下的自动分析。
3.2缺点
(1)计算量大。
(2)样本不平衡时,对稀少类的分率准确率较低。