本节我们将继续基于 Scikit-Learn 库的相关模块,向大家介绍 Python 中一些模型验证及调优的工具。
为了方便后续的演示,首先导入示例数据集 iris,并对数据特征与标记(即模型的自变量与因变量)进行提取划分:
我们构建一个 KNN 分类模型 model,用于验证准备:
模型拟合与预测:
导入 metrics 模块的 accuracy_score 函数,该函数能够帮助我们计算模型的准确率:
交叉验证是机器学习中常用的模型验证方法,这需要我们将数据集划分为训练集与验证集,cross_validation 模块中的 train_test_split 函数能够帮助我们实现较轻松的划分:
未完待续:课程内容较多,请复制链接通过电脑学习,获得最佳学习效果。 http://datacademy.io/lesson/138
更多课程和文章尽在微信号:「datartisan数据工匠」