1. 为什么要做特征归一化/标准化? 数据预处理中,通常会用到特征归一化,为什么要做归一化呢?一般有两点: 消除特征间单位和尺度差异的影响特征间的单位(尺度)可能不同。比如身...
1. 为什么要做特征归一化/标准化? 数据预处理中,通常会用到特征归一化,为什么要做归一化呢?一般有两点: 消除特征间单位和尺度差异的影响特征间的单位(尺度)可能不同。比如身...
本文是对bert的细节进行整理,分成3个部分的问题: 目录 输入 与transformer相比输入有什么不同? bert的3种embedding分别有什么意义,如果实现的? ...
正则化(Regularization)是机器学习中一种常用的技术,其主要目的是控制模型复杂度,减小过拟合。最基本的正则化方法是在原目标(代价)函数 中添加惩罚项,对复杂度高的...
本文是对transformer的细节进行整理,主要有以下问题: Transformer为什么Q和K使用不同的权重矩阵生成,为何不能使用同一个值进行自身的点乘? 关于 self...
在我们的业务场景中,优化指标是总的商机数(联系经纪人算是商机),通过对业务指标进行拆解,将目标拆分成: 提升用户搜索次数 提升搜索pctr(pctr表示点击次数/请求数) 提...
wide&deep和deepFM在推荐搜索中比较常见,这里对原理不做过多介绍,主要想说下特征处理。 1. wide&deep 模型结构 wide&deep结合了LR和DNN,...
1. 信息熵 参考信息熵是什么?- D.Han的回答-知乎[https://www.zhihu.com/question/22178202/answer/223017546]...
本文主要介绍tensorflow和pyspark对svd的实现,具体原理可见上篇-SVD在协同过滤推荐系统中的应用 大纲 SVD 代码实践之tensorflow SVD 代码...
提纲 解决的问题 方法 启发与疑问 1. 解决的问题 简单点说,本文是为了解决在商品推荐中如何表示用户对不同种类商品的兴趣。举个例子,一位年轻的妈妈浏览过或者购买过很多种类的...