字符串的匹配在平常的编码过程中非常常用,在编程语言中通常是调用一个内置函数就可以实现字符串的匹配,当不让使用内置的函数,而是自己编写一个函数来实现匹配的功能,应该如何来写呢?...

字符串的匹配在平常的编码过程中非常常用,在编程语言中通常是调用一个内置函数就可以实现字符串的匹配,当不让使用内置的函数,而是自己编写一个函数来实现匹配的功能,应该如何来写呢?...
链表是线性表的一种实现方式,它的基本想法是: 将表中的元素分别存放在各个独立的存储区内,存储区又称为结点; 在表中,可以通过任意结点找到与之相关的下一个结点; 在前一个结点上...
大量的数据对机器学习算法的研究很有帮助,当我们直到算法有较高的方差(variance)时,增加m会有助于改善算法。但是当m很大时,比如m=100,000,000时,在这种情况...
批量梯度下降是每一次迭代中对所有样本求和后求梯度项,随机梯度下降是对每一个样本求梯度项,小批量梯度下降介于两者之间。 小批量梯度下降取的样本数一般在2-100之间:例如样本总...
以线性回归为例:预测函数为:代价函数: 重复:{} 当数据量过大时,梯度下降的算法会变得很慢,因为要对所有的数据进行求和。因为每次重复梯度下降都是所有数据全部求和,所以梯度下...
推荐系统是目前非常流行的机器学习应用。特征值对机器学习是非常重要的,而对特征值的选择会直接影响到算法的好坏,推荐系统能够自动帮助学习一些优良的特征值,帮助更好的实现算法。 举...
异常检测(Anomaly Detection)是机器学习算法的一个常见应用。它主要用于非监督学习,但又类似一些监督学习问题。 异常检测常用在对网站异常用户的检测;还有在工程上...
降维是机器学习中很重要的一种思想。在机器学习中经常会碰到一些高维的数据集,它们会占用计算机的内存和硬盘空间,而且在运算时会减缓速度。降维能够使得数据量被压缩,加快运算速度,减...
从没有标记过的数据中学习称之为非监督学习。在非监督学习中,通过算法来定义一些数据的结构,将数据分别聚合到这些子集中,这种算法称之为聚类算法。 K均值 (K-means) 算法...
高斯核函数 激励函数中 现在准备用新的特征值 来替换 将定义为两个向量的相似度: 例如,有一个标记向量,某个样本的特征向量和其的相似度为: PS: 是 x向量的范数。 该核函...
在解决复杂的非线性分类问题时,除了逻辑回归和神经网络,还有一种更为强大的算法:叫做支持向量机(Support Vector Machines),简称SVM。 代价函数 在分类...
在处理分类问题时,会遇到一种情况: 假设一个二元分类问题:假设我们的预测算法是:,这个算法忽略特征值,不管任何情况下都是预测等于0。 毫无疑问这是一个糟糕的算法,但是在测试集...
在使用学习算法解决机器学习问题时,可能预测函数的误差很小,但是这个学习算法不确定是不是准确的,因为可能出现过拟合的情况。 因为仅仅用一个训练集来判断学习算法是否准确是不行的,...
参数展开 在神经网络中,我们有一些参数矩阵,例如: 有时为了使用方便,需要将这些矩阵统一到一个向量中去 这样就合并了三个矩阵,假如 是一个的矩阵,是一个的矩阵,是一个的矩阵则...
定义一些参数: = 神经网络的层数 = 层的单元数,但不包括偏差单元 = 输出层的单元数,二元分类是1,大于二的就是k 逻辑回归的代价函数为: 神经网络的代价函数: 是一个K...
在解决分类问题时,可以用逻辑回归算法,但当解决复杂的非线性分类器时,这并不是一个好的选择。如果用逻辑回归来解决,首先要构造一个包含很多非线性项的逻辑回归函数。使用逻辑回归会构...
判断垃圾邮件,这个分类问题的输出是[0, 1],只有固定的两个输出值,这称之为二元分类问题。在生活中有许多另外的分类问题,给定一张数字的图像,判断是数字几;自动将邮件归类,归...
在应用线性回归和逻辑回归去解决某些机器学习的实际应用时,它们可能会出现一种叫做“过度拟合”(Overfitting)的问题。这会使得学习的结果很糟糕。 什么是过拟合 用预测房...
逻辑回归的代价函数: 与线性回归一样,它的梯度下降算法类似: 重复直到收敛 {} 计算后会得到: 计算后得到的和线性回归的看上去没有区别,但是两者的不同。线性回归的是:逻辑回...