本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 之前对算法原理和推导写的比较多,评价指标、信息熵较少,补充下。 机器学习算法中经常会用到各种熵,如决策树、...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 之前对算法原理和推导写的比较多,评价指标、信息熵较少,补充下。 机器学习算法中经常会用到各种熵,如决策树、...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 之前的文章没有对评价指标进行一个梳理,此小结补充一下建模过程中一些常用的评价指标。 最近项目在做点击率预估...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 (2)SVDD (one class SVM) SVDD的思路其实不难,基本思想是:既然只有一个class,...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 我们日常项目中经常会遇到数据不均衡的情况,这非常普遍,例如某动物分类项目的类别数量占比为300:100:9...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 最近项目有用到Sim_hash,做个简单记录。 Sim_hash是Google用来处理大量文本去重的算...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 主成分分析(Principal Component Analysis,PCA)是中最常用的降维算法之一,...
我这么理解的,因为L(wt)是向量v的反方向,所以v=-L(wt)。又因为v是单位向量,要除以摸
梯度下降推导本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 梯度下降算法是机器学习、深度学习中更新模型参数最常用的算法,从公式上看,比较简单,只需要设定更新步长和计算一阶...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 支持向量机(SVM)是算法工程师最耳熟能详的机器学习模型之一,这节对SVM作粗略的推导。 SVM旨在找到一...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 FM通过对于每一位特征的隐变量内积来提取特征组合,最后的结果还不错,理论上FM可以对高阶特征组合进行建模,...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 之前介绍了FM,接下来是它的改进版本FFM,加入了领域Field思想。在FM模型中,每一个特征会对应一个...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 在计算广告中使用逻辑回归等算法进行CTR(广告点击率)、CVR(转化率)等预估时,类别特征经过One hot...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 异常检测是指在一堆数据样本中,通过各种方法找出脱离正常范围的数据,即异常样本、异常数据。异常检测应用领域...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 近年来目标检测算法主要包括两种类型:One Stage和Two Stage。之前已经介绍了R-CNN、F...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 Negative Sampling(负采样)其实理解起来不是很难,个人觉得比分层Softmax相对简单一...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 上一篇介绍了word2vec两种基础模型CBOW和Skip-gram的训练过程,但是我们发现这样可能会出...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 看了许多网上word2vec的博客,感觉有点乱一大堆公式(可能我太菜了 0_0),花了两天自己整理了一下...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 正则化是机器学习中常用解决过拟合,减低模型复杂程度的技术。方法比较简单就是在损失函数后添加惩罚项L1、L...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 从之前Fast R-CNN文章的介绍中知道,它已经把很多工作集成到一个端对端CNN网络进行训练,但是依然存...
本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 Fast R-CNN建立在R-CNN和SPP的工作基础之上,使用了多种创新方法提升检测速度和准确率。 ...