240 发简信
IP属地:北京
  • var const let的区别

    var var 声明提升,就是把所有变量声明都拉到函数作用域的顶部,且反复多次使用var声明同一个变量也不会有问题,只是会覆盖上一个变量 var声明的变量,成为window对...

  • var const let的区别

    var var 声明提升,就是把所有变量声明都拉到函数作用域的顶部,且反复多次使用var声明同一个变量也不会有问题,只是会覆盖上一个变量 var声明的变量,成为window对...

  • 变分推断EM算法

    目标L:计算后验分布p(z|x) 方法:构建q(z)去近似p(z|x) KL散度是用来衡量两个分布之间的距离,当距离=0时,表示两个分布完全一致。 ELBO: Evidenc...

  • 120
    LDA主题模型

    (一)LDA主题模型问题 问题1:一篇文章,生成乐观主题、悲观主题的概率假设独立同分布(服从伯努利分布),生成n个主题。 设生成乐观主题的概率为θ。 1.伯努利分布Berno...

  • 120
    多目标优化在推荐中的应用

    多目标排序通常是指有两个或两个以上的目标函数,寻求一种排序使得所有的目标函数都达到最优或满意。 在推荐系统中,大多产品都是基于隐式反馈进行推荐,导致评估用户满意度的时候有不同...

  • CNN笔记

    概念 1)卷积核=过滤器filter: 每个卷积核有长宽深3个维度 2)feature map: 在cnn的每个卷积层,数据都是以三维形式存在的。你可以把它看成许多个二维图片...

  • CNN

    概念1)卷积核=过滤器filter:每个卷积核有长宽深3个维度 2)feature map:在cnn的每个卷积层,数据都是以三维形式存在的。你可以把它看成许多个二维图片叠在一...

  • KNN-KD树

    k最近邻(kNN)算法是一种分类与回归的方法,假设我们给定一个searching point,打算在训练数据集中找到一个与该searching point最近的k个数据点,利...

  • 树算法

    信息增益的计算方法 https://blog.csdn.net/it_beecoder/article/details/79554388 决策树--信息增益,信息增益比,Ge...

  • LSTM

    sigmoid 用在了各种gate上,产生0~1之间的值,这个一般只有sigmoid最直接了。 tanh 用在了状态和输出上,是对数据的处理,这个用其他激活函数或许也可以。 ...

  • 最大熵模型

    最大似然函数 解释: 一般形式是 假设样本集大小为n,X的取值有k个:,用表示在观测值中样本xi出现的频数。 显然:对和对优化是等价的 故得证。 忽略θ,更一般的公式: 一旦...

  • 120
    CRF模型

    CRF概念 随机场是由若干个位置组成的整体,当给每一个位置中按照某种分布随机赋予一个值之后,其全体就叫做随机场。 马尔科夫随机场是随机场的特例,它假设随机场中某一个位置的赋值...

  • 堆排序

    堆分为最大堆和最小堆,其实就是完全二叉树。 最大堆要求节点的元素都要不小于其孩子,最小堆要求节点元素都不大于其左右孩子,两者对左右孩子的大小关系不做任何要求 输出:初始化大顶...

  • 120
    FTRL在线最优化

    (一)RDA(Regularized Dual Averaging) 是微软的研究成果,它更有效地提升了特征权重的稀疏性。 算法原理--特征权重的更新策略为:---公式(1)...