在互联网早期,随着网络上的网页逐渐增多,如何从海量网页中检索出我们想要的页面,变得非常的重要。 当时著名的雅虎和其它互联网公司都试图解决这个问题...
之前介绍到的一些机器学习算法都是监督学习算法。所谓监督学习,就是既有特征数据,又有目标数据。 而本篇文章要介绍的K 均值算法是一种无监督学习。 ...
上篇文章介绍了KNN 算法的原理[https://www.jianshu.com/p/717abaf6954d],今天来介绍如何使用KNN 算法...
KNN 算法的全称是K-Nearest Neighbor,中文为K 近邻算法,它是基于距离的一种算法,简单有效。 KNN 算法即可用于分类问题,...
在进行数据分析的时候,经常需要将数据进行可视化,以方便我们对数据的认识和理解。 0,Matplotlib 简介 Matplotlib[https...
一般在机器学习的模型训练之前,有一个比较重要的步骤是数据变换。 因为,一般情况下,原始数据的各个特征的值并不在一个统一的范围内,这样数据之间就没...
生活中,我们经常会对比两个事物的相关性,也可以叫做相似度。 如果一件事物与另一件事物的相似度比较高,那这两件事物的相关性就比较大。 如果一件事物...
上篇介绍了朴素贝叶斯的原理[https://www.jianshu.com/p/2235cc3677b4],本篇来介绍如何用朴素贝叶斯解决实际问...
贝叶斯原理是英国数学家托马斯·贝叶斯于18 世纪提出的,当我们不能直接计算一件事情(A)发生的可能性大小的时候,可以间接的计算与这件事情有关的事...