深度学习 - 文集

深度学习

10篇文章 · 6800字 · 3人关注

从图片相似度学习图片的表示
很多时候带分类标注的图片样本是很难获得的，但是图片之间的相似度却不难获得。最简单的方式有几个：视频里相邻的帧是相似的。见论文Unsupervi...

0.1 8763 9 30 2
Tensorflow 的NCE-Loss的实现和word2vec
这两天因为实现mxnet的nce-loss，因此研究了一下tensorflow的nce-loss的实现。所以总结一下。先看看tensorflo...

0.6 39226 9 18 1

word2vec/lstm on mxnet with NCE loss
Softmax是用来实现多类分类问题常见的损失函数。但如果类别特别多，softmax的效率就是个问题了。比如在word2vec里，每个词都是一个...

5895 2 7 2
基于DC/OS建立分布式机器学习系统
之前基于ps-lite实现了word2vec。下一步就是让这个算法能够分布式的跑起来。最简单的分布式方案大概是如下几步：把二进制文件copy到你...

1312 1 7
基于ps-lite实现分布式的word2vec
ps-lite是一个参数服务器(ps)的实现。在有参数服务器之前，其实也就5年前，大部分分布式机器学习算法都是靠定期同步来实现的，比如MPI的a...

3405 1 3
用Mxnet实现矩阵分解
在《关于LDA, pLSA, SVD, Word2Vec的一些看法》一文中我们提到了SVD的算法。之前TensorFlow刚出来时，就听说可以很...

4681 1 5
端到端的OCR：LSTM＋CTC的实现
前面提到了用CNN来做OCR。这篇文章介绍另一种做OCR的方法，就是通过LSTM＋CTC。这种方法的好处是他可以事先不用知道一共有几个字符需要识...

0.2 41770 50 23

端到端的OCR：基于CNN的实现
OCR是一个古老的问题。这里我们考虑一类特殊的OCR问题，就是验证码的识别。传统做验证码的识别，需要经过如下步骤：这里最难的就是分割。如果字符...

10359 5 13
离散特征和连续特征同时存在，同时解决回归和分类的问题
有些同学对于mxnet的自定义Iter不是很熟悉，对多输出也不熟悉，因此我用一个比较复杂的例子来说明这个问题：本着End-to-End的精神，...

8303 0 4