k 均值聚类算法的工作流程是这样的:首先选取 k 个点,作为初始 k 个簇的中心(这个 k 是人为设定的超参数),然后将其余的数据对象分配到距离...
俗语有云:“人以群分,物以类聚”。简单来说,聚类指的是将物理或抽象对象集合分成由相似对象组成的多个类的过程。从这个简单的描述中可以看出,聚类的关...
我们知道,深度学习网络是目前非常热门的研究议题。但在本质上,深度学习网络就是层数较多的神经网络。虽然 sklearn 并不支持深度学习,但久经时...
聚类操作得有数据才行,这里我们先用 sklearn 的数据生成工具 make_blobs( ) 来合成所需的数据。make_blobs( ) 方...
在掌握 Logistic 回归的基本原理之后,下面我们通过实战来感受一下这个模型。由于模型的求解过程(如梯度下降法、牛顿法)和正则化流程都被封装...
本节教程我们来讨论另外一种被广泛应用的分类算法— Logistic 回归。在讲解这个概念之前,我们先来聊一个题外话—“Logistic regr...
如何自学成长入门阶段目标一:会用数据分析的方式解决一些简单的业务问题1.通读《深入浅出数据分析》 所有问题一开始都会有实际业务场景的引入 然后会...
k 均值聚类算法的优点很明显,那就是原理简单、易于操作,并且执行效率非常高,因此该算法得到了广泛的应用。但它也有不足,大体上有以下四点。 1) ...
本教程中的 k-近邻算法实战,使用的数据集是非常经典的鸢尾花数据集。该数据集最初是由美国植物学家埃德加·安德森(Edgar Anderson)整...