[第003号]
摘要
分类问题是机器学习、信息检索、计算机视觉、多媒体等多个学科的最重要的基础问题之一。随着数据的急剧增加,现实应用中的很多分类问题在计算效率、存储需求等方面产生了巨大挑战。该论文针对这一问题提出了基于哈希编码的解决方案。与以往的哈希研究不同的是,该工作中提出的算法不仅对数据进行二值哈希编码,还首创对分类器也同时进行二值化学习。通过这一创新,该算法将分类问题转化为了一个高效的哈希码搜索问题,极大地提高了分类算法的效率。该算法的有效性在多个真实的数据上得到了验证。
研究过程
1. 介绍
本文主要贡献:
(1)We difine a novel problem by binarizing both classifiers and image features and simulataneously learing them in a unfied formulation.
(2)An efficient solver is proposed for the binary optimization problem.
(3)Our formulation supports a large family of empirical loss functions and is here instantiated by exponential/linear losses.
2. 相关工作
2.1 Hashing for fast image search and beyond
2.2 Hashing for large-scale optimization
3. 模型
3.1 指数损失函数的学习
3.2 线性损失函数的学习
3.3 二值编码预测
3.4 讨论
4. 实验
4.1 数据集
SUN397
ImageNet
Caltech-256
4.2 被比较的方法和评估指标
4.3 准确率和计算效率
4.4 内存消耗
reduce the storage cost by converting high-dimensional real-valued features and classfication models to compact binary codes.
4.5 评估解析模型
5. 结论
心得体会
我的体会